2026年5月19日AgentsOpen SourceFramework

ViMax 把视频生成做成一个剧组

HKUDS 把 ViMax 推上 GitHub Trending,今天 +504 颗星,总数 5.4k。端到端视频生成做成多 agent 系统——Director、Screenwriter、Producer、Video Generator。你扔进去一个想法或者一章小说,它从剧本走到分镜,再到多机位,再到一致性检查,最后出片。

ViMax 的有趣点不是画质,画质取决于你接哪个后端模型(Google AI Studio、MiniMax 或其他)。是它结构上的判断:长视频生成的瓶颈在角色一致性、场景连续性、参考图管理。这些是协调问题不是像素问题。用专门的 agent 加连续性闸门来解决,而不是堆一个巨型模型,是个真实的结构论证。

四个入口:Idea2Video(想法到故事)、Novel2Video(整本小说到剧集)、Script2Video(自己的剧本到成片)、AutoCameo(你的照片变成片中角色)。MIT 许可。开发活跃,329 个 commit 还没正式 release。

如果你一直在等 "多 agent 做某件事" 从研究论文热词变成可建造的产品,ViMax 在视频领域是我见过最干净的样本之一。

GitHub: https://github.com/HKUDS/ViMax
← 上一篇
Forge 把 8B 本地模型逼出 86 分
下一篇 →
SkillsVote 给 Agent 技能库装上投票闸门
← 返回所有文章

评论

加载中...
>_