2026年5月3日Funding-Series A Agents Research

Standard Intelligence拿到7500万用像素训computer agent

两个在Atlas Fellowship认识的小孩刚拿了7500万美元A轮，Sequoia和Spark领投。Galen Mead 21岁，Devansh Pandey 20岁。他们的赌注：放弃语言和tool call，直接用人在用电脑的原始视频训agent，让模型从像素直接预测下一个鼠标动作、点击和键盘输入。像特斯拉FSD，但面向知识工作。

Standard Intelligence第一个基础模型叫FDM-1，他们说是基于业内最大的电脑动作数据集——1100万小时。他们的视频编码器在100万token上下文里塞下30FPS的两小时视频，比竞品省50倍。还自建了30PB存储集群，花了不到50万美元。比hyperscaler同等容量便宜20倍。

FDM-1能在Blender里挤压CAD齿轮，能在旧金山街道上微调一小时后开车，能通过探索状态空间调试软件。Stanley Druckenmiller和Andrej Karpathy是顾问。6个人在旧金山，pre-money估值4.25亿美元。他们内部判断：FDM-1已经把computer use从数据受限切到了算力受限。

这是对Anthropic Computer Use、OpenAI Operator、Manus Cloud Computer那一票产品的反向押注——那些方案都是截图+tool call。Standard Intelligence的意思是：语言根本就不是桌面agent的正确抽象。如果他们对了，所有截图+文字的方案这一年都在烧错钱。如果错了，视频数据就是2026年最贵的负面结果。

官网：https://si.inc/

← 上一篇

Autoresearch 那个循环没问题，是市场不让它赚钱

Netomi 1.1亿美元C轮埃森哲Adobe押注高难度CX agent

← 返回所有文章

加载中...

Standard Intelligence拿到7500万 用像素训computer agent

相关文章

评论

Standard Intelligence拿到7500万用像素训computer agent