首页 - 自媒体资讯 > AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本

发布于：2025-01-19 作者：xcadmin 阅读：1 当前页面链接：https://lawala.cn/post/12566.html

欢迎来到【AI日报】栏目，这里是你每日探索人工智能世界的指南针，我们聚焦开发者与创新产品，助你洞悉技术趋势、了解创新AI产品应用，为你开启智能科技的新篇章。

1. OpenAI推出全新模型系列OpenAI o1

OpenAI推出了全新的模型系列o1，这个新模型在推理能力上表现得更加出色，为用户解决了复杂问题提供了更强的推理能力，用户需要调整提示方式以适应o1模型的工作方式，提示工程发生了重大变革，用户需要给出简单直接的提示，避免使用思路链提示，并使用分隔符来明确模型解析的部分，限制额外上下文以避免复杂回答。

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本,image.png,OpenAI,2,4,3,第1张

【AiBase提要:】

- 🤖 需要简单、直接的提示：o1模型已经具备内部推理能力，不需要复杂的思路链提示。

- 🧠 避免使用思路链提示：因为o1模型已经具备内部推理能力。

- 📋 使用分隔符来明确模型解析的部分：并限制额外上下文以避免复杂回答。

- 💡 提升用户体验，注重工具可访问性和专业价值：公司选择稳健发展道路，提升用户体验。

详情链接: [openai.com/index/introducing-openai-o1-preview](https://openai.com/index/introducing-openai-o1-preview)

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本,AI日报：探索人工智能的无限可能,OpenAI,2,4,3,第2张

2. Google Gemini Live语音聊天向安卓用户免费开放，随时随地与AI聊天!

谷歌宣布Gemini Live语音聊天模式现在免费向所有安卓用户开放，意味着每个人都可以体验智能对话AI的乐趣，用户可以随时用声音提问，甚至在回答过程中打断，为用户带来了流畅的语音交互体验，Gemini Live为用户提供了一种新的交互方式，无论在家中还是外出，都能随时与AI进行有趣的对话。

【AiBase提要:】

- 🌟 Gemini Live语音聊天功能现在免费向所有安卓用户开放!

- 🗣️ 用户可以直接用声音提问，甚至在回答时打断。

- 🌍 目前仅支持英文，未来将在iOS上推出并支持更多语言。

详情链接: [google.com/openai/index/introducing-gemini-live-voice-chat](https://google.com/openai/index/introducing-gemini-live-voice-chat)

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本,image.png,OpenAI,2,4,3,第3张

![video.mp4](https://upload.chinaz.com/2024/0913/6386182823217158724466562.mp4)

3. Midjourney 7.0 版本或在 2个月内发布，一次性可生成 8 张图，正开发 3D 系统

Midjourney创始人David Holz在Discord上分享公司最新项目进展，强调技术创新以竞争AI图像生成领域，公司推迟发布7.0版本，但功能更丰富，包括多图生成、图像编辑器、3D系统、个性化功能和视频生成等，公司计划推出多图生成、图像编辑器、3D系统、个性化功能和视频生成等新特性。

【AiBase提要:】

- 🚀 7.0版本推迟但功能更丰富：重点在提高技术可访问性和工具专业价值。

- 🎨 新功能包括多图生成、图像编辑器、3D系统、个性化功能和视频生成等：提升用户体验。

- 💡 Midjourney选择稳健发展道路：注重实用功能和用户体验，以保持竞争优势。

详情链接: [top.aibase.com/tool/midjourneywangyeban](https://top.aibase.com/tool/midjourneywangyeban)

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本,AI日报：探索人工智能的无限可能,OpenAI,2,4,3,第4张

4. 元象发布MoE开源大模型XVERSE-MoE-A36B

作为中国最大的Mixture ofof Experts（MoE）开源大模型，XVERSE-MOE-A36B的发布标志着中国在AI领域的重大进步，将国产开源技术提升至国际领先水平，该模型的性能和效率带来了训练时间的缩短、推理性能的提升以及AI应用成本的降低，为中小企业、研究者和开发者提供了更多选择机会。

【AiBase提要:】

- 🚀 XVERSE-MOE-A36B拥有255B总参数和36B激活参数：性能可媲美超过100B参数的大模型，实现跨级的性能跃升。

- 🏅 MoE架构通过组合多个细分领域的专家模型：打破传统扩展定律的局限，保持模型性能<span class="spamTxt">最大化</span>。

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本,image.png,OpenAI,2,4,3,第5张

- 🌐 元象MoE在<span class="spamTxt">权威评测</span>中超越了多个同类模型：包括国内千亿MoE模型Skywork-MoE、传统MoE霸主Mixtral-8x22B等。

详情链接: [huggingface.co/xverse/XVERSE-MoE-A36B](https://huggingface.co/xverse/XVERSE-MoE-A36B)

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本,AI日报：探索人工智能的无限可能,OpenAI,2,4,3,第6张

5. 文生视频模型Runway Gen-2迎来重要更新：支持多模态输入和突破性性能提升

Runway Gen-2 1.4版本的发布标志着这款开源文本转视频（TTI）模型在多语言支持和性能方面取得了重大突破，更新展现了强大的技术实力和广阔的应用前景。

【AiBase提要:】

- 🌐 多语言支持大幅提升：训练数据量翻倍至70万小时，支持8种主要语言，拓展了应用范围。

- ⚡ 性能与功能全面升级：超低延迟和快速速度，即时语音克隆功能，灵活部署选项和API服务。

- 📺 应用前景广阔：教育领域支持语言学习，娱乐产业即时语音克隆，辅助视障人士技术和智能客服与跨文化交流。

- 🚀 教育领域：支持语言学习。

- 🎥 娱乐产业：即时语音克隆，实现内容与购物的无缝连接。

- 👁️‍⚕️ 辅助视障人士技术：实时语音克隆功能。

- 💬 智能客服和跨文化交流：提供即时翻译和语音克隆服务。

详情链接: [fish-zh.cn/auth/audio](https://fish-zh.cn/auth/audio)

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本,image.png,OpenAI,2,4,3,第7张

![video.mp4](https://upload.chinaz.2024/0913/6386183424217158521457662.mp4)

6. 告别幻觉!DataGemini统计数据暴涨58%，准确率显著提升

Google推出新的开源AI模型DataGemini，旨在解决大数据统计中的幻觉问题，常在处理统计数据时常出现的大模型“幻觉”，DataGemini利用Google的数据共享平台Data Commons，显著提升模型回答统计查询的准确性，初步测试显示，DataGemini在统计查询准确性方面有显著提升。

【AiBase提要:】

- 📊 DataGemini利用Google的数据共享平台Data Commons：增强模型回答数据的准确性。

- 📂 DataGemini利用Google的数据共享平台Data Commons：增强模型回答数据的准确性。

- 🔍 DataGemini在初步测试中显示出显著的统计查询准确性提升：初步测试显示，DataGemei在统计查询准确性方面有显著提升。

详情链接: [huggingface.co/collections/google/datagemema](https://huggingface.co/collections/google/datagemema)

AI领域最新进展：OpenAI推出更强推理模型o1，Midjourney 7.0支持一次性生成8张图像，开源语音模型Fish Speech更新至1.4版本,AI日报：探索人工智能的无限可能,OpenAI,2,4,3,第8张

7. Jina AI推出Reader-LM小型语言模型

Jina AI推出的Reader-LM小型语言模型为将原始HTML内容转换为干净整洁的Markdown格式提供了便利，摆脱了繁琐的网页数据处理，该模型快速高效，自动剔除杂乱网页内容，展现出

扫一扫关注我们

当前页面链接：https://lawala.cn/post/12566.html

标签： #OpenAI #2 #4 #3

上一篇：微信与抖音强化电商布局，新推搜索功能电商入口

下一篇：余承东谈足球：自谦门外汉，愿分享团队管理心得

苹果iPhone 16系列备货量增至9500万台，展现市场信心

苹果公司最近一个月两次增加iPhone16系列手机的备货量，相关备货量已增至9500万部，显示出对新产品销售的信心。内部人士表示，苹果公司推出的AppleInt...

2025-01-22
OpenAI遭监管调查：被指限制员工安全隐患举报

OpenAI因涉嫌使用限制性保密协议限制员工发声再次受到审查。OpenAI被曝强制员工签署所谓的过度限制性”协议，此举严重阻碍了员工揭露公司技术可能带来的潜在风...

2025-01-22
美国310亿旗舰木星探测任务遇阻：晶体管辐射难题待解

曾经叱咤风云的美国航天，如今各种不顺利，宇航员在空间站回不来，重返月球一再推迟，对木卫二的旗舰探测任务欧罗巴”也遇到了大麻烦：晶体管太脆弱，扛不住宇宙辐射。欧罗...

2025-01-22
6700万参数模型挑战GPT-4，微软MIT合作破解Transformer推理难题

「因果推理」绝对是当前GenAI热潮下的小众领域，但是它有一个大佬级的坚定支持者——YannLeCun。他在推特上的日常操作之一，就是炮轰Sora等生成模型，并...

2025-01-22
AI机器人伴侣风靡美国老年人群体，84岁老人重拾笑容

【新智元导读】84岁的美国老人DorothyElicati在失去结婚65年的丈夫后，每天醒来唯一做的事就是哭泣，直到一个AI机器人的出现。美国会每年花费70万美...

2025-01-22
头部主播跨界短剧，能否续写带货传奇？

2024年，头部主播集体瞄准了短剧赛道。最新涌入的玩家是薇娅夫妇。直播带货之后，头部主播们寄希望于通过短剧实现业绩增长，或许难度系数比直播带货本身还要大。...

2025-01-22