2026年3月19日Research Benchmark Infrastructure

Google DeepMind 发布 AGI 认知评估框架，配套 20 万美元 Kaggle 黑客松

Google DeepMind 发布了一套用于衡量 AGI 进展的认知框架，并配套推出 20 万美元奖金的 Kaggle 黑客松以众包评估方案。论文于 3 月 16 日发表，黑客松 3 月 17 日开放，持续至 4 月 16 日。

该框架确定了被认为对通用智能至关重要的 10 项认知能力：感知、生成、注意力、学习、记忆、推理、元认知、执行功能、问题解决和社会认知。基于心理学和神经科学数十年的研究，框架提出了一套严格的评估协议——通过一系列定向认知任务测试系统表现，生成「认知画像」以呈现优势和短板。

Kaggle 黑客松聚焦于评估缺口最大的五项能力：学习、元认知、注意力、执行功能和社会认知。这恰恰是区分自主代理和简单聊天机器人的关键能力——代理需要从经验中学习、监控自身推理、在多任务间管理注意力、规划和执行多步工作流、理解社交情境。

这对代理生态意义重大：它提供了首个标准化方式来衡量 AI 系统是否正在发展代理所需的认知能力。社区不再只依赖特定任务基准，而是拥有了评估底层认知架构的统一框架。

论文：https://blog.google/innovation-and-ai/models-and-research/google-deepmind/measuring-agi-cognitive-framework/
Kaggle 黑客松：3 月 17 日至 4 月 16 日提交，6 月 1 日公布结果。

← 上一篇

Lightfield：让 AI 代理接管数据录入的新一代 CRM

Newton 1.0：用于训练机器人代理的开源物理引擎正式发布

← 返回所有文章

加载中...

Google DeepMind 发布 AGI 认知评估框架，配套 20 万美元 Kaggle 黑客松

相关文章

评论