首页 - 自媒体资讯 > AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线

AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线

发布于:2025-01-21 作者:xcadmin 阅读:2 当前页面链接:https://lawala.cn/post/15682.html

新鲜AI产品点击了解:<strong><a href="https://top.aibase.com/"</a></strong>

1. OpenAI推出GPT-4o新版本**

开发者: OpenAI
链接: https://openai.com/index/introduce-structured-outputs-in-the-api/

OpenAI近期推出了全新的结构化输出功能,这一功能的推出为开发者提供了更为可靠的基础,简化开发过程,并帮助开发者创建出色的应用,具体来说,该功能使得模型生成的输出更加符合预期,提升了输出的可靠性和匹配度,Python和Node.js SDK已更新,支持结构化输出,简化了开发者的工作流程。

2. 面壁智能MiniCPM v2.6**

开发者: 面壁智能
链接: https://github.com/OpenBMB/OpenBMB

AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线,image.png,GPT-4o,2,4,3,第1张

MiniCPM v2.6是一款端侧多模态人工智能模型,尽管仅有8B参数,却取得了SOTA成绩,全面超越了GPT-4Vision水平,这款模型在单图、多图和视频理解方面均表现卓越,具有极高的像素密度和运行效率,它还支持多种语言和推理框架,适用于广泛的应用场景。

3. 阿里云PAI ArtLab新增奥运高光时刻海报工作流**

开发者: 阿里云
链接:https://xsmhd.cn

阿里云PAI ArtLab平台新增了一个奥运高光时刻海报工作流,用户只需三步即可生成个性化的奥运主题海报,用户需要在阿里云官网注册并进行实名认证,然后访问PAI ArtLab平台领取免费资源,并通过加载流程解锁更多海报设计,这个工具不仅简化了设计流程,还促进了共享与交流。

4. 腾讯元宝AI助手长文精读功能**

AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线,image.png,GPT-4o,2,4,3,第2张

开发者: 腾讯
链接:https://xsmhd.cn

腾讯元宝AI助手推出了长文精读功能,支持上传专业内容后进入深度阅读模式,该功能提供核心内容概览、模块化解析和总结性图表,帮助用户快速理解关键信息,利用腾讯混元大模型的处理能力,用户还可以评估论文质量、查看专业图表和离线回看精读内容。

5. 月之暗面Kimi开放平台 Cache缓存存储费用降价50%**

开发者:链接:https://xsmhd.cn

Kimi开放平台宣布将上下文缓存存储费用降价50%,从每1M tokens/min降为5元,这是一种高效的数据管理技术,能够预先存储可能被频繁请求的大量数据,从而提高系统效率和节省时间资源。

AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线,image.png,GPT-4o,2,4,3,第3张

6. Figure公司发布超强实体机器人ChatGPT Figure02**

开发者:链接:https://nv3dprojects.org/j3d-projects/proj3d-3v-demo/

Figure公司发布了一款名为Figure02的实体机器人,具备灵活的手部操作能力和强大的对话视觉能力,这款机器人在硬件和软件上进行了全面革新,标志着人机交互进入了新时代,其核心技术包括语音、手部和视觉系统的集成。

7. 华为和复旦大学联合打造3D Emo新框架**

开发者:链接:https://nv3dprojects.org/j3d-projects/proj3d-3v-demo/

AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线,image.png,GPT-4o,2,4,3,第4张

研究团队提出了一种合成可控的新情感数字人方法,通过构建“语音到几何”映射框架和EmoMap数据集,实现了从语音到面部表情动画的合成,这项技术显著提升了数字人在情感表达方面的丰富性和真实感。

8. 上海人工智能实验室推出书生系列InternLM2.5版本**

开发者:链接:https://intern.nlpaia.org.cn

书生系列InternLM2.5版本在复杂场景下的推理能力得到显著增强,适应不同应用场景和开发者需求,模型包括1.8B、20B和30B三种参数版本,支持自适应超长上下文搜索和互联网信息整合。

9. 以色列公司推出速度提升50%的开源Whisper Medusa**

AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线,image.png,GPT-4o,2,4,3,第5张

开发者:链接:https://github.com/aiola-labs/whisper_medusa

Whisper Medusa引入了多头注意力机制,使模型能够同时预测多个token,从而显著提高了语音预测速度和生成运行时间,尽管性能提升显著,但主干系统仍建立在Whisper的基础上,保证了准确性和稳定性。

10. Reddit将测试AI驱动的搜索结果页面**

开发者:链接:https://nv3dprojects.org/j3d-projects/proj3d-3v-demo/

Reddit计划推出AI驱动的搜索结果页面,以提供AI生成的内容摘要,帮助用户更轻松地找到感兴趣的内容,这将由OpenAI的大型语言模型构建,并与Reddit合作进行微调。

AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线,image.png,GPT-4o,2,4,3,第6张

11. 亚马逊升级AI图像生成器Titan Image Generator v2**

开发者:链接:https://top.aibase.com/tool/amazon-titan-text-premier

Titan Image Generator v2引入了多项新功能,包括图像调节、配色方案控制和背景去除等,用户可以上传参考图像和文本提示来生成符合布局和结构要求的图像,还能通过十六进制颜色代码控制生成图像的配色方案,背景去除功能也得到了显著提升。

12. 摩尔线程摩笔马良创作平台全新升级**

开发者:链接:https://top.aibase.com/tool/amazon-titan-text-premier

AI领域最新动态:GPT-4o新版本发布,面壁智能推出手机版“GPT-4V”,华为推出3D数字人框架EmoTalk3D,阿里奥运海报工作流上线,image.png,GPT-4o,2,4,3,第7张

摩尔线程摩笔马良创作平台全新升级,提供更高效、个性化的图像生成体验,强化对中文和中国文化的理解,实现精准创意人像生成,新增20多种预置风格满足多样化创意需求,AI算法和交互体验显著提升,图像生成高速高分辨率。

13. Reddit将测试AI驱动的搜索结果页面**

开发者:

<strong>链接:</strong <a href="https://nv3dprojects.org/j3d-projects/proj3d-3v-

二维码

扫一扫关注我们

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 dousc@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

当前页面链接:https://lawala.cn/post/15682.html

标签: #GPT-4o #2 #4 #3

相关文章

发表评论

自媒体

电话咨询
自定义链接2