TAG:世界模型
机器人告别逐帧动作学习 全球首个事件级具身智能世界模型发布
5月29日,自变量机器人团队发布全球首个事件级具身智能世界模型WALL-WM,革新传统逐帧学习方式,采用以事件为中心的预测机制,提升机器人理解和执行任务的泛化能力。该模型通过工程重构和数据系统优化,在多项指标上领先,为具身智能领域带来突破性进展。
WAM世界动作模型详解
本文为零基础读者介绍WAM(世界动作模型)的核心概念,解释其如何让机器人通过预测世界变化来生成相应动作。文章对比了WAM与VLA模型,详细探讨了世界表征方式(如图像、点云和潜空间)以及学习世界规律的生成式建模方法,如flow matching。旨在帮助理解WAM在提升机器人自主决策能力中的应用价值。
硅谷扎堆押注LLM,杨立昆另辟蹊径,JEPA架构能否成为具身智能最优解?
本文基于图灵奖得主杨立昆的深度访谈,探讨了他对当前大语言模型(LLM)技术路线的批评。杨立昆指出LLM的自回归架构限制了推理能力,并提出了以视觉为基础的世界模型作为替代方案。他介绍了JEPA架构,该架构在抽象表示空间中进行预测,旨在实现更高效的具身智能。文章分析了这些观点对AI行业未来发展的潜在影响。
专访具脑磐石CEO朱森华:做一个“可靠的大脑”,铸造具身智能基石
本文专访具脑磐石CEO朱森华,探讨具身智能行业对“大脑”的追求。朱森华指出,行业需从依赖试错的“全民炼丹”转向基于脑科学理论的“可靠大脑”,以实现技术落地和商业化。文章介绍了具脑磐石的最新融资和技术路线,强调认知世界模型和可落地性的重要性,为行业提供洞察。
WEM:分开世界与自我具身世界模型才能走得更远
本文探讨了具身世界模型在长时序任务中的挑战,指出单流视频生成模型容易导致场景漂移和交互错误。作者提出World-Ego Modeling(WEM)范式,将预测责任拆分为稳定的场景规律(World)和机器人中心的交互动态(Ego)。这种方法能更好地处理导航-操作混合任务,提升模型的场景一致性和动作准确性,为具身智能的发展提供新视角。
智象未来CEO梅涛:AI公司的竞争,正从模型能力转向产品能力与场景化落地
本文基于对智象未来CEO梅涛的访谈,探讨了AI行业竞争的新趋势。梅涛指出,随着技术发展,AI公司的竞争焦点正从模型能力转向产品能力与场景化落地。他详细分析了世界模型的现状与挑战,强调多模态生成技术尚未收敛,为创业公司提供了机会。文章还分享了智象未来的商业策略,聚焦于差异化模型和行业应用,为读者提供了对AI产业分层和商业化路径的深刻见解。
解码世界模型发展新图景——世界科学咖啡・吴中专场圆满举办
5月19日,世界科学咖啡・吴中专场活动在苏州吴中区成功举办,聚焦世界模型技术从‘理解世界’到‘重塑未来’的范式转移。活动汇聚政企学研资多方力量,探讨世界模型在具身智能领域的应用与产业落地,为吴中区机器人产业注入创新动能,推动高质量发展。通过主题分享、战略签约和技术研讨,活动明晰了科技趋势与投资风向,促进了产业生态构建与区域合作。
解析具身智能核心技术:三大技术路线构建虚实交互新范式
本文解析具身智能的核心技术,介绍运动跟踪、视觉-语言-动作模型和世界模型三大技术路线如何构建虚实交互新范式。这些技术共同推动人工智能从虚拟推理迈向物理世界的感知-决策-行动闭环,驱动机器人、自动驾驶和先进制造等领域的未来变革,揭示技术融合与虚实交互的价值。
Runway估值超53亿美元,超越谷歌,专注视频生成
Runway作为一家专注于生成式AI视频的初创公司,估值飙升至53亿美元,成为AI领域的一匹黑马。不同于押注语言模型的巨头,Runway坚信视频是理解物理世界的关键,其Gen-4.5模型在好莱坞影视制作中占据主导地位,并进军科学基础设施领域,推动基础科学突破。尽管面临谷歌等科技巨头的竞争,Runway凭借艺术基因和高效管理,在AI视频赛道上加速狂奔。
北京人形 Pelican‑Unify 1.0 登顶世界第一,具身大脑能力跻身第一梯队
北京人形机器人创新中心的Pelican-Unify 1.0模型在WorldArena全球权威评测中双冠加冕,成为全球唯一在两大核心赛道同时夺冠的企业。该模型统一了理解、推理、想象与行动能力,推动了具身智能从功能拼凑向协同进化转变,标志着其在世界模型能力上跻身世界第一梯队,为通用具身智能的实现奠定了关键技术基础。
世界模型成为具身智能的关键技术叙事
本文深入探讨了世界模型如何成为具身智能领域的核心技术叙事。文章分析了技术从VLA模型向世界模型的范式转移,强调世界模型在物理因果理解和具身决策中的关键作用。通过WorldArena国际评测体系,展示了中国公司如流形空间、生数科技等的领跑地位和技术突破,同时提及了资本市场的狂热投入。整体上,文章提供了对具身智能大脑技术演进的冷静思考,记录了智能体从有躯体到有智慧的进化历程。
VLA已死的背后:具身智能真正的难题从未被说清楚
本文深入剖析了“VLA已死”这一行业热点言论,指出其背后是具身智能领域对物理能力泛化难题的忽视。文章区分了语义和物理两道坎,强调VLA在语义理解上的突破掩盖了物理交互的复杂性,并讨论了世界模型的作用与局限。核心价值在于澄清行业叙事对底层问题的压缩,呼吁关注任务、场景和对象泛化等真正挑战。
开普勒前CEO胡德波创立索塔无界,用世界模型实现Scaling Law
前华为和开普勒CEO胡德波创立索塔无界,专注于开发通用具身智能大脑系统。通过自研的统一潜空间世界动作模型(UL-WAM),让机器人原生理解物理世界,解决当前具身智能的物理幻觉和数据瓶颈问题。公司采用全栈整机出海策略,瞄准欧美市场,提供高ROI的机器人解决方案,已在商超零售等领域实现商业闭环。
这家AI公司发布世界模型、适配20家硬件并跑通10余场景,旨在成为具身智能的“大脑供应商”
晨昏线科技是一家专注于具身智能“大脑”开发的AI公司,通过发布目标因果世界模型TermiBrain GCWM1,构建了世界模型、Agent框架和多模型协同的三层技术架构。公司已适配约20家具身硬件厂商,在工业检测、航空测试等10余个真实场景中跑通项目,致力于成为多场景作业的模型供应商,推动机器人从表演转向实际作业,提升商业价值。
具身智能基础设施厂商Zenbot完成近亿元天使轮融资
具身智能基础设施厂商Zenbot宣布完成近亿元天使轮融资,由长盈精密、科达利等精密制造头部企业家族办公室领投。融资将用于迭代研发通用具身智能世界模型、基于GaN驱动的核心关节模组量产、通讯架构推广及全栈系统设计能力强化。Zenbot通过全栈技术解决产业链断裂问题,提供从部件到智能的一站式解决方案,已在12个月内斩获近亿元订单,覆盖全球头部客户,推动机器人规模化落地。