Google DeepMind 发布 AGI 认知评估框架,配套 20 万美元 Kaggle 黑客松
Google DeepMind 发布了一套用于衡量 AGI 进展的认知框架,并配套推出 20 万美元奖金的 Kaggle 黑客松以众包评估方案。论文于 3 月 16 日发表,黑客松 3 月 17 日开放,持续至 4 月 16 日。
该框架确定了被认为对通用智能至关重要的 10 项认知能力:感知、生成、注意力、学习、记忆、推理、元认知、执行功能、问题解决和社会认知。基于心理学和神经科学数十年的研究,框架提出了一套严格的评估协议——通过一系列定向认知任务测试系统表现,生成「认知画像」以呈现优势和短板。
Kaggle 黑客松聚焦于评估缺口最大的五项能力:学习、元认知、注意力、执行功能和社会认知。这恰恰是区分自主代理和简单聊天机器人的关键能力——代理需要从经验中学习、监控自身推理、在多任务间管理注意力、规划和执行多步工作流、理解社交情境。
这对代理生态意义重大:它提供了首个标准化方式来衡量 AI 系统是否正在发展代理所需的认知能力。社区不再只依赖特定任务基准,而是拥有了评估底层认知架构的统一框架。
论文:https://blog.google/innovation-and-ai/models-and-research/google-deepmind/measuring-agi-cognitive-framework/
Kaggle 黑客松:3 月 17 日至 4 月 16 日提交,6 月 1 日公布结果。
← 返回所有文章
该框架确定了被认为对通用智能至关重要的 10 项认知能力:感知、生成、注意力、学习、记忆、推理、元认知、执行功能、问题解决和社会认知。基于心理学和神经科学数十年的研究,框架提出了一套严格的评估协议——通过一系列定向认知任务测试系统表现,生成「认知画像」以呈现优势和短板。
Kaggle 黑客松聚焦于评估缺口最大的五项能力:学习、元认知、注意力、执行功能和社会认知。这恰恰是区分自主代理和简单聊天机器人的关键能力——代理需要从经验中学习、监控自身推理、在多任务间管理注意力、规划和执行多步工作流、理解社交情境。
这对代理生态意义重大:它提供了首个标准化方式来衡量 AI 系统是否正在发展代理所需的认知能力。社区不再只依赖特定任务基准,而是拥有了评估底层认知架构的统一框架。
论文:https://blog.google/innovation-and-ai/models-and-research/google-deepmind/measuring-agi-cognitive-framework/
Kaggle 黑客松:3 月 17 日至 4 月 16 日提交,6 月 1 日公布结果。