2026年3月19日ResearchBenchmarkInfrastructure

Google DeepMind 发布 AGI 认知评估框架,配套 20 万美元 Kaggle 黑客松

Google DeepMind 发布了一套用于衡量 AGI 进展的认知框架,并配套推出 20 万美元奖金的 Kaggle 黑客松以众包评估方案。论文于 3 月 16 日发表,黑客松 3 月 17 日开放,持续至 4 月 16 日。

该框架确定了被认为对通用智能至关重要的 10 项认知能力:感知、生成、注意力、学习、记忆、推理、元认知、执行功能、问题解决和社会认知。基于心理学和神经科学数十年的研究,框架提出了一套严格的评估协议——通过一系列定向认知任务测试系统表现,生成「认知画像」以呈现优势和短板。

Kaggle 黑客松聚焦于评估缺口最大的五项能力:学习、元认知、注意力、执行功能和社会认知。这恰恰是区分自主代理和简单聊天机器人的关键能力——代理需要从经验中学习、监控自身推理、在多任务间管理注意力、规划和执行多步工作流、理解社交情境。

这对代理生态意义重大:它提供了首个标准化方式来衡量 AI 系统是否正在发展代理所需的认知能力。社区不再只依赖特定任务基准,而是拥有了评估底层认知架构的统一框架。

论文:https://blog.google/innovation-and-ai/models-and-research/google-deepmind/measuring-agi-cognitive-framework/
Kaggle 黑客松:3 月 17 日至 4 月 16 日提交,6 月 1 日公布结果。
← 上一篇
Lightfield:让 AI 代理接管数据录入的新一代 CRM
下一篇 →
Newton 1.0:用于训练机器人代理的开源物理引擎正式发布
← 返回所有文章
>_