首页 - 自媒体资讯 > OpenAI开发者大会发布四大创新,提示词缓存技术大幅降低输入成本

OpenAI开发者大会发布四大创新,提示词缓存技术大幅降低输入成本

发布于:2025-01-18 作者:xcadmin 阅读:1 当前页面链接:https://lawala.cn/post/11245.html

OpenAI开发者大会发布四大创新,提示词缓存技术大幅降低输入成本,OpenAI,DevDay,实时API,视觉微调,OpenAI新工具发布,DevDay2023创新功能,第1张

首先亮相的是Realtime API,目前正处于公开测试阶段,这款API使开发者能够构建低延迟、多模态的对话体验,支持文本和音频的输入与输出,以及函数调用,通过GPT-4o模型的强大支持,开发者可以向模型发送任何文本或音频提示,并以他们选择的格式接收响应,这大大简化了语音助手和其他会话式AI工具的创建过程,省去了复杂的模型拼接需求,包括转录、推理和文字转语音转换等步骤。

GPT-4o是OpenAI最新的大型语言模型(LLM),现在增加了视觉微调功能,使开发者能够定制模型以提高图像理解能力,类似于文本微调,开发者可以准备图像数据集并将其上传到OpenAI的平台,只需最少100张图片,就能显著提升GPT-4o在视觉任务上的表现,而使用更大的数据集则可以获得更进一步的改进,东南亚的食品配送和叫车服务公司Grab就利用这项技术增强了他们的地图服务。

Prompt Caching是一个革命性的更新,它大幅降低了开发者的成本和延迟,许多AI应用涉及在多个API调用中使用相同的上下文,如编辑代码库或与聊天机器人进行长时间的多轮对话,Prompt Caching自动重用最近处理过的输入令牌,从而实现50%的费用折扣和更快的提示处理时间。

OpenAI推出了新的模型蒸馏产品,为开发者提供了一个集成的工作流程,直接在OpenAI平台上管理蒸馏过程,这使得他们可以利用尖端模型如o1-preview和GPT-4o的输出来微调并提高更经济实惠模型(如GPT-4o mini)的性能,现在,小型公司也可以享受到类似最先进模型的能力,而无需承担使用这些模型所伴随的计算成本。

二维码

扫一扫关注我们

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 dousc@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

当前页面链接:https://lawala.cn/post/11245.html

标签: #OpenAI #DevDay #实时API #视觉微调 #OpenAI新工具发布 #DevDay2023创新功能

相关文章

发表评论

自媒体

电话咨询
自定义链接2