TAG:VLA

机器人不能永远“借脑”：具身原生正成为行业新分水岭

机器人无法永远“借脑”于通用大模型。具身智能正面临关键范式转折：它究竟是大模型能力向物理世界的外溢，还是需要生长出真正属于机器人的原生智能范式？本文深入剖析数字世界模型与物理世界在时间尺度、因果关系、错误成本等方面的根本错配，指出当前“取巧”式迁移的局限。行业先锋提出“具身原生”路线，主张围绕动作、接触、状态变化重构数据、训练目标、架构与评测体系。LingBot-VA 2.0的发布标志着这一转变的开始，或将成为具身智能赛道新的行业分水岭。

具身研习社

2026-07-10 19:18

机器人不能永远“借脑”：具身原生正成为行业新分水岭

具身研习社

2026-07-10 19:17

“烧”掉了百亿美元, 世界模型的概念都还没有统一

过去一年，超100亿美元资金涌入世界模型与机器人AI领域，杨立昆预言其将取代LLM成为主流范式，Jim Fan喊出“VLA已死”。然而，业界对“世界模型”至今没有统一定义，从渲染器、模拟器、规划器到不同技术路径（像素中心、三维结构、潜空间等），概念混沌与落地期待形成巨大反差。本文对比LLM的“下一个Token”预测，剖析世界模型“预测下一个物理状态”的本质，并指出数据稀缺与物理规律理解两大核心瓶颈，清晰呈现这一前沿赛道的现状与挑战。

OFweek机器人网

2026-07-07 18:59

不再只是会走路的双臂平台：OpenHLM解放人形机器人全身移动操作能力

清华大学交叉信息研究院推出开源项目OpenHLM，为人形机器人提供一套完整的VLA配方。该系统突破传统“会走路的双臂平台”局限，让机器人能像人类一样协调手、腰、腿、脚完成语言驱动的全身移动操作任务，包括下蹲取物、脚踩踏板、推车等。通过三阶段系统实验，确定了最优全身遥操作接口、多步flow动作生成方式及低成本HuMI等异构数据协同训练方法，在HLM-12基准上验证了其高效泛化能力，为具身智能提供实用开源方案。

具身研习社

2026-06-29 16:31

研究称对 VLA 进行过度改写式初始化会削弱机器人执行能力，VLA 初始化应如何进行？

CUHK等团队系统实验VLM底座在VLA初始化中的价值：预训练通用表征不可丢弃，补具身能力需精准对症（空间、定位、规划等），LoRA轻量改造优于全量微调，底座越强保留价值越大。避免VLM被过度改造导致机器人控制能力下降。给出VLA初始化5大经验与实验结论，为具身智能VLA设计提供实用指导。

具身研习社

2026-06-15 19:13

对话智源研究院理事长黄铁军：构建完整的世界模型是一条漫长的道路

对话智源研究院理事长黄铁军：世界模型与VLA路线并非对立，VLA是企业现实选择，而完整世界模型目标是打造通用大脑。构建涵盖物理、化学、生物等多领域规律的模型仍为漫长道路，更现实目标是获机器人常识能力。黄铁军强调数据需转向实时交互，耳机、智能眼镜等可穿戴设备将加速推动同步感知数据采集，为具身智能提供新“数据燃料”。

每日经济新闻

2026-06-13 22:04

上海创智学院与上海交通大学联合智动未来提出MINT模型：让VLA从模仿轨迹走向理解意图

本文介绍上海创智学院、上海交大等提出的MINT框架，聚焦VLA模型的强泛化与强迁移能力。MINT通过频谱分解动作词元化与意图—执行分层生成，让机器人不再只模仿轨迹，而是理解行为意图，从而提升组合泛化与小样本迁移能力。

具身研习社

2026-06-10 17:05

全球首个事件级世界模型，终结具身智能逐帧时代

本文介绍了全球首个事件级预测的具身智能世界模型WALL-WM，由自变量机器人团队发布。文章批评了传统逐帧学习方法的局限性，导致机器人泛化能力差，无法适应多变环境。WALL-WM模型通过以事件为中心的方法，直接预测关键事件（如抓住杯子）的动作轨迹，跳过冗余帧，提升学习效率和真实世界适应性。文章还讨论了多模态对齐问题，并比较了VLA与世界模型的路线，为机器人智能提供了更高效、语义化的学习框架。

具身研习社

2026-06-01 19:28