苹果iPhone 16系列备货量增至9500万台,展现市场信心
苹果公司最近一个月两次增加iPhone16系列手机的备货量,相关备货量已增至9500万部,显示出对新产品销售的信心。内部人士表示,苹果公司推出的AppleInt...
2025-01-22
新鲜AI产品点击了解:<strong><a href="https://top.aibase.com/"</a></strong>
1. OpenAI推出GPT-4o新版本**
开发者: OpenAI
链接: https://openai.com/index/introduce-structured-outputs-in-the-api/
OpenAI近期推出了全新的结构化输出功能,这一功能的推出为开发者提供了更为可靠的基础,简化开发过程,并帮助开发者创建出色的应用,具体来说,该功能使得模型生成的输出更加符合预期,提升了输出的可靠性和匹配度,Python和Node.js SDK已更新,支持结构化输出,简化了开发者的工作流程。
2. 面壁智能MiniCPM v2.6**
开发者: 面壁智能
链接: https://github.com/OpenBMB/OpenBMB
MiniCPM v2.6是一款端侧多模态人工智能模型,尽管仅有8B参数,却取得了SOTA成绩,全面超越了GPT-4Vision水平,这款模型在单图、多图和视频理解方面均表现卓越,具有极高的像素密度和运行效率,它还支持多种语言和推理框架,适用于广泛的应用场景。
3. 阿里云PAI ArtLab新增奥运高光时刻海报工作流**
开发者: 阿里云
链接:https://xsmhd.cn
阿里云PAI ArtLab平台新增了一个奥运高光时刻海报工作流,用户只需三步即可生成个性化的奥运主题海报,用户需要在阿里云官网注册并进行实名认证,然后访问PAI ArtLab平台领取免费资源,并通过加载流程解锁更多海报设计,这个工具不仅简化了设计流程,还促进了共享与交流。
4. 腾讯元宝AI助手长文精读功能**
开发者: 腾讯
链接:https://xsmhd.cn
腾讯元宝AI助手推出了长文精读功能,支持上传专业内容后进入深度阅读模式,该功能提供核心内容概览、模块化解析和总结性图表,帮助用户快速理解关键信息,利用腾讯混元大模型的处理能力,用户还可以评估论文质量、查看专业图表和离线回看精读内容。
5. 月之暗面Kimi开放平台 Cache缓存存储费用降价50%**
开发者:链接:https://xsmhd.cn
Kimi开放平台宣布将上下文缓存存储费用降价50%,从每1M tokens/min降为5元,这是一种高效的数据管理技术,能够预先存储可能被频繁请求的大量数据,从而提高系统效率和节省时间资源。
6. Figure公司发布超强实体机器人ChatGPT Figure02**
开发者:链接:https://nv3dprojects.org/j3d-projects/proj3d-3v-demo/
Figure公司发布了一款名为Figure02的实体机器人,具备灵活的手部操作能力和强大的对话视觉能力,这款机器人在硬件和软件上进行了全面革新,标志着人机交互进入了新时代,其核心技术包括语音、手部和视觉系统的集成。
7. 华为和复旦大学联合打造3D Emo新框架**
开发者:链接:https://nv3dprojects.org/j3d-projects/proj3d-3v-demo/
研究团队提出了一种合成可控的新情感数字人方法,通过构建“语音到几何”映射框架和EmoMap数据集,实现了从语音到面部表情动画的合成,这项技术显著提升了数字人在情感表达方面的丰富性和真实感。
8. 上海人工智能实验室推出书生系列InternLM2.5版本**
开发者:链接:https://intern.nlpaia.org.cn
书生系列InternLM2.5版本在复杂场景下的推理能力得到显著增强,适应不同应用场景和开发者需求,模型包括1.8B、20B和30B三种参数版本,支持自适应超长上下文搜索和互联网信息整合。
9. 以色列公司推出速度提升50%的开源Whisper Medusa**
开发者:链接:https://github.com/aiola-labs/whisper_medusa
Whisper Medusa引入了多头注意力机制,使模型能够同时预测多个token,从而显著提高了语音预测速度和生成运行时间,尽管性能提升显著,但主干系统仍建立在Whisper的基础上,保证了准确性和稳定性。
10. Reddit将测试AI驱动的搜索结果页面**
开发者:链接:https://nv3dprojects.org/j3d-projects/proj3d-3v-demo/
Reddit计划推出AI驱动的搜索结果页面,以提供AI生成的内容摘要,帮助用户更轻松地找到感兴趣的内容,这将由OpenAI的大型语言模型构建,并与Reddit合作进行微调。
11. 亚马逊升级AI图像生成器Titan Image Generator v2**
开发者:链接:https://top.aibase.com/tool/amazon-titan-text-premier
Titan Image Generator v2引入了多项新功能,包括图像调节、配色方案控制和背景去除等,用户可以上传参考图像和文本提示来生成符合布局和结构要求的图像,还能通过十六进制颜色代码控制生成图像的配色方案,背景去除功能也得到了显著提升。
12. 摩尔线程摩笔马良创作平台全新升级**
开发者:链接:https://top.aibase.com/tool/amazon-titan-text-premier
摩尔线程摩笔马良创作平台全新升级,提供更高效、个性化的图像生成体验,强化对中文和中国文化的理解,实现精准创意人像生成,新增20多种预置风格满足多样化创意需求,AI算法和交互体验显著提升,图像生成高速高分辨率。
13. Reddit将测试AI驱动的搜索结果页面**
开发者:
<strong>链接:</strong <a href="https://nv3dprojects.org/j3d-projects/proj3d-3v-
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 dousc@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
当前页面链接:https://lawala.cn/post/15682.html
相关文章
苹果公司最近一个月两次增加iPhone16系列手机的备货量,相关备货量已增至9500万部,显示出对新产品销售的信心。内部人士表示,苹果公司推出的AppleInt...
2025-01-22
曾经叱咤风云的美国航天,如今各种不顺利,宇航员在空间站回不来,重返月球一再推迟,对木卫二的旗舰探测任务欧罗巴”也遇到了大麻烦:晶体管太脆弱,扛不住宇宙辐射。欧罗...
2025-01-22
「因果推理」绝对是当前GenAI热潮下的小众领域,但是它有一个大佬级的坚定支持者——YannLeCun。他在推特上的日常操作之一,就是炮轰Sora等生成模型,并...
2025-01-22
【新智元导读】84岁的美国老人DorothyElicati在失去结婚65年的丈夫后,每天醒来唯一做的事就是哭泣,直到一个AI机器人的出现。美国会每年花费70万美...
2025-01-22
2024年,头部主播集体瞄准了短剧赛道。最新涌入的玩家是薇娅夫妇。直播带货之后,头部主播们寄希望于通过短剧实现业绩增长,或许难度系数比直播带货本身还要大。...
2025-01-22
国内风头最盛的AI视频团队是哪家?毫无疑问,快手可灵。发布一个月,体验用户超30万,生成700万条短视频,开放网页Web端。要不大家老说呢,技术人才们总是喜欢蛰...
2025-01-22
发表评论