Standard Intelligence拿到7500万 用像素训computer agent
两个在Atlas Fellowship认识的小孩刚拿了7500万美元A轮,Sequoia和Spark领投。Galen Mead 21岁,Devansh Pandey 20岁。他们的赌注:放弃语言和tool call,直接用人在用电脑的原始视频训agent,让模型从像素直接预测下一个鼠标动作、点击和键盘输入。像特斯拉FSD,但面向知识工作。
Standard Intelligence第一个基础模型叫FDM-1,他们说是基于业内最大的电脑动作数据集——1100万小时。他们的视频编码器在100万token上下文里塞下30FPS的两小时视频,比竞品省50倍。还自建了30PB存储集群,花了不到50万美元。比hyperscaler同等容量便宜20倍。
FDM-1能在Blender里挤压CAD齿轮,能在旧金山街道上微调一小时后开车,能通过探索状态空间调试软件。Stanley Druckenmiller和Andrej Karpathy是顾问。6个人在旧金山,pre-money估值4.25亿美元。他们内部判断:FDM-1已经把computer use从数据受限切到了算力受限。
这是对Anthropic Computer Use、OpenAI Operator、Manus Cloud Computer那一票产品的反向押注——那些方案都是截图+tool call。Standard Intelligence的意思是:语言根本就不是桌面agent的正确抽象。如果他们对了,所有截图+文字的方案这一年都在烧错钱。如果错了,视频数据就是2026年最贵的负面结果。
官网:https://si.inc/
← 返回所有文章
Standard Intelligence第一个基础模型叫FDM-1,他们说是基于业内最大的电脑动作数据集——1100万小时。他们的视频编码器在100万token上下文里塞下30FPS的两小时视频,比竞品省50倍。还自建了30PB存储集群,花了不到50万美元。比hyperscaler同等容量便宜20倍。
FDM-1能在Blender里挤压CAD齿轮,能在旧金山街道上微调一小时后开车,能通过探索状态空间调试软件。Stanley Druckenmiller和Andrej Karpathy是顾问。6个人在旧金山,pre-money估值4.25亿美元。他们内部判断:FDM-1已经把computer use从数据受限切到了算力受限。
这是对Anthropic Computer Use、OpenAI Operator、Manus Cloud Computer那一票产品的反向押注——那些方案都是截图+tool call。Standard Intelligence的意思是:语言根本就不是桌面agent的正确抽象。如果他们对了,所有截图+文字的方案这一年都在烧错钱。如果错了,视频数据就是2026年最贵的负面结果。
官网:https://si.inc/
评论