首页 - 自媒体资讯 > Meta发布全新AI模型审计工具，助力评估其他人工智能系统

Meta发布全新AI模型审计工具，助力评估其他人工智能系统

发布于：2025-01-15 作者：xcadmin 阅读：1 当前页面链接：https://lawala.cn/post/9674.html

10月20日，站长之家（ChinaZ.com）报道：Facebook母公司Meta于当地时间周五正式发布了其研究部门开发的一批新AI模型，其中最引人注目的是一个名为“自学评估器”（Self-Taught Evaluator）的创新工具，这个工具的出现，可能为减少人类在AI开发过程中的参与度提供了一条新路径。

Meta发布全新AI模型审计工具，助力评估其他人工智能系统,Meta，元宇宙，Facebook,Meta,人工智能,AI模型,AI头条,发布,AI,OpenAI,第1张

此次发布的自学评估器紧随Meta在8月份发表的一篇论文之后，该论文详细介绍了如何利用OpenAI最近发布的o1模型中的“思维链”技术，使模型能够对其输出进行可靠判断，这种技术通过将复杂问题拆解为更小的逻辑步骤，显著提高了在科学、编程和数学等领域解决难题的准确性。

Meta的研究人员完全使用AI生成的数据来训练这个评估器模型，彻底消除了人工输入的需求，这不仅展示了未来实现自主AI智能体的可能性，还意味着这类智能体可以从自身错误中学习并不断改进，两位Meta研究员向路透社表示，这种自我学习和自我评估的能力是超越人类水平的关键。

许多人设想，这类智能体可以作为高度智能的数字助手，在无需人类干预的情况下执行广泛的任务，自我改进的AI模型有望取代当前常用的昂贵且低效的基于人类反馈的强化学习（RLHF）过程，这种方法要求具有专业知识的人类标注员来标记数据并验证复杂数学和写作问题的答案是否正确。

“我们希望，随着AI的发展，它能越来越好地检查自己的工作，从而超越普通人的表现。”该项目研究员之一Jason Weston说道，他认为，自我学习和自我评估是实现这种超越人类水平AI的关键。

包括谷歌和Anthropic在内的其他公司也发布了关于RLAIF（基于AI反馈的强化学习）概念的研究，但与Meta不同的是，这些公司通常不会公开发布其模型供公众使用。

除了自学评估器外，Meta还在周五发布了其他几个AI工具，包括对公司图像识别模型Segment Anything的更新、一种加快大语言模型（LLM）响应生成时间的工具，以及可用于发现新型无机材料的数据集。

问答环节：

问：什么是“自学评估器”？

答：“自学评估器”是一种由Meta开发的AI模型，它能够自我评估其输出结果，从而减少对人工输入的需求，这项技术依赖于OpenAI的“思维链”方法，通过将复杂问题分解成更小的逻辑步骤来提高准确性。

问：为什么说“自学评估器”对未来的AI发展具有重要意义？

Meta发布全新AI模型审计工具，助力评估其他人工智能系统,Meta发布新AI模型，开启自主评估新时代,Meta,人工智能,AI模型,AI头条,发布,AI,OpenAI,第2张

答：因为这种模型展示了未来实现自主AI智能体的可能性，这些智能体可以从自身错误中学习并不断改进，最终有可能超越人类的表现，它还可以减少对昂贵且低效的基于人类反馈的强化学习过程的依赖。

问：除了“自学评估器”，Meta还发布了哪些新的AI工具？

答：除了“自学评估器”外，Meta还发布了以下几种新的AI工具：

- 对公司图像识别模型Segment Anything的更新；

- 一种加快大语言模型（LLM）响应生成时间的工具；

- 一个用于发现新型无机材料的数据集。

问：其他公司在RLAIF领域有哪些进展？

答：包括谷歌和Anthropic在内的其他公司也在进行RLAIF（基于AI反馈的强化学习）的研究，与Meta不同的是，这些公司通常不会公开发布其模型供公众使用。

扫一扫关注我们

当前页面链接：https://lawala.cn/post/9674.html

标签： #Meta #人工智能 #AI模型 #AI头条 #发布 #AI #OpenAI

上一篇：Redmi G27Q显示器震撼上市：2K 180Hz高刷，首发价949元！

下一篇：半小时内克隆官网：骗子轻松篡改内容

OpenAI遭监管调查：被指限制员工安全隐患举报

OpenAI因涉嫌使用限制性保密协议限制员工发声再次受到审查。OpenAI被曝强制员工签署所谓的过度限制性”协议，此举严重阻碍了员工揭露公司技术可能带来的潜在风...

2025-01-22
6700万参数模型挑战GPT-4，微软MIT合作破解Transformer推理难题

「因果推理」绝对是当前GenAI热潮下的小众领域，但是它有一个大佬级的坚定支持者——YannLeCun。他在推特上的日常操作之一，就是炮轰Sora等生成模型，并...

2025-01-22
AI机器人伴侣风靡美国老年人群体，84岁老人重拾笑容

【新智元导读】84岁的美国老人DorothyElicati在失去结婚65年的丈夫后，每天醒来唯一做的事就是哭泣，直到一个AI机器人的出现。美国会每年花费70万美...

2025-01-22
头部主播跨界短剧，能否续写带货传奇？

2024年，头部主播集体瞄准了短剧赛道。最新涌入的玩家是薇娅夫妇。直播带货之后，头部主播们寄希望于通过短剧实现业绩增长，或许难度系数比直播带货本身还要大。...

2025-01-22
揭秘快手可灵背后的「关键7人」

国内风头最盛的AI视频团队是哪家?毫无疑问，快手可灵。发布一个月，体验用户超30万，生成700万条短视频，开放网页Web端。要不大家老说呢，技术人才们总是喜欢蛰...

2025-01-22
自动驾驶技术在雨天环境下的平稳规划：北理港中文腾讯提出端到端学习道路几何图形方案

用几何图形来实时构建高精地图，真香!就是雨天也不在话下~我们都知道，实时高精地图，能为自动驾驶汽车提供及时、紧凑且语义丰富的环境信息。但如何提高它的稳健性、有效...

2025-01-22