
产品介绍
MolmoAct 2 是一个开源的动作推理模型,能够在指挥机器人执行动作之前进行 3D 推理,无需针对单个任务进行微调即可处理双臂协作任务,运行速度比初代 MolmoAct 快 37 倍。专为机器人研究人员和机器学习工程师打造。
适合谁关注
- 开发者和技术团队
- 产品经理、运营和高频知识工作者
- 教育产品团队和学习工具用户
- 正在评估 AI 工具或智能体落地的团队
可借鉴场景
- 快速理解 MolmoAct 2 的定位、核心能力和 Product Hunt 热度
- 判断“在行动前进行 3D 推理的开源机器人模型”这类需求是否值得做竞品调研
- 沿着 AI 与智能体、Robots 继续发现同类产品和替代方案
94
投票数
3
评论数
5月9日
发布日期
作者自荐
总结
MolmoAct 2 由 Ai2 推出,直击机器人基础模型领域长期存在的核心痛点——数据封闭与不可复现。当前绝大多数机器人基础模型依赖专有数据训练,外部研究者既无法验证也无法复用,严重制约了学术界与产业界的协同进步。MolmoAct 2 反其道而行,同步开放了 700 小时的双臂操作数据集、动作分词器和模型权重,构建了一条完整的开源研究链路。技术层面,双臂协作能力直接嵌入基础模型而非依赖逐任务微调,大幅降低了部署门槛;3D 推理先于动作执行的架构设计也提升了操作精度。37 倍的推理加速更使其具备实时应用潜力。潜在挑战在于开源生态能否形成足够的社区贡献闭环,以及模型在训练硬件之外的真实泛化表现仍需更多验证。
GitMemo免费开源
把 AI 对话保存到你的 Git 知识库
本地优先,支持 macOS 与 Android。剪贴板、截图、笔记和文件都能集中保存、搜索、同步。
获取安装包

700 小时的双臂机器人演示数据,全部开源——这正是机器人领域一直缺失的训练资源。 这是什么:MolmoAct 2 是 Ai2 推出的开源动作推理模型,能够在指挥物理机器人动作之前进行 3D 推理。该模型部分基于 MolmoAct 2-Bimanual YAM 数据集进行训练,这是迄今为止发布的最大规模开源双臂机器人数据集。 大多数机器人基础模型基于专有数据训练,实验室外的人无法审查或在此基础上构建。这使得结果几乎无法复现,也限制了谁能对该领域做出实质性贡献。 Ai2 以不同的方式构建了 MolmoAct 2,从数据入手。MolmoAct 2-Bimanual YAM 数据集涵盖 700 小时的双臂操作演示——折叠毛巾、扫描杂货、清理桌面、为智能手机充电等。其包含的机器人数据量是初代 MolmoAct 训练数据的 30 倍以上。 独特之处:双臂协作能力内置于基础模型中,而非通过逐任务微调添加。语言标注经过重新标注,唯一指令标签从 71,000 个增加到约 146,000 个,使模型对真实世界的措辞变化更具鲁棒性。 数据集还补充了涵盖不同机械臂、摄像头配置和控制方案的更广泛数据,使模型的泛化能力超越训练硬件。 核心特性: 700 小时 MolmoAct 2-Bimanual YAM 数据集,完全开源 原生双臂操作能力,无需逐任务微调 重新标注的语言指令,增强措辞鲁棒性 MolmoAct 2-Think 变体,配备自适应深度感知 token 已公开参考硬件配置:YAM 机械臂、俯视和近距摄像头、桌面工作空间 优势: 研究人员可以直接研究、复现并基于训练数据进行扩展 数据集涵盖多种机械臂、摄像头和控制方案,实现更广泛的泛化 开源动作分词器与模型权重同步发布 训练代码即将以开源许可证发布 适用人群:需要开放训练数据和可复现方案来构建或改进操作模型的机器人研究人员和机器学习工程师。 机器人 AI 领域的数据问题与模型问题同样重要。将两者同时发布,正是这次发布值得关注的原因。