TAG:开源框架
丰田开源机器人AI训练完整流水线,涵盖从零到抓取全过程
丰田研究院(TRI)开源了其内部训练机器人视觉-语言-动作模型(VLA)的完整框架VLA Foundry。该框架提供了从语言预训练到机器人动作学习的全流程工具,包括模型权重、仿真评估工具等,使研究者能够从零开始训练机器人大脑,解决了现有框架碎片化的问题,促进了机器人研究的开放性和可访问性。
十方融海“小智AI”开源框架:GitHub获26000星,接入设备超13万
十方融海在2026广东AI应用对接大会介绍“小智AI”开源智能体框架:GitHub超26000星、10万开发者共建,接入设备超130万台。框架以国产大模型+开源协议+硬件终端构成三层架构,主打多模态、低成本部署和生态协同,已在教育、AI玩具、音箱、机器人与智能家居等场景实现规模化落地。
DeepSeek-V4爆火背后:北大开源框架One-Eval如何终结AI测评“噩梦”
本文聚焦DeepSeek-V4发布后北大DCAI团队10小时完成自动化评测的案例,解析开源框架One-Eval如何以自然语言智能体、全链路可追溯与人工在环机制,破解大模型评测中的高门槛、黑盒与数据污染难题,并揭示评测产业“诊断+数据补全”的商业闭环及开源带来的行业变量。
首个开源世界模型与VLA框架VISTA发布,助力通用机器人低成本落地
北京智源人工智能研究院联合多家高校发布首个开源“世界模型+VLA”框架VISTA,通过“世界模型规划+GoalVLA执行”双层协同与视觉subgoal机制,提升机器人在跨场景、跨本体及未见物体操作中的泛化能力,为通用机器人低成本规模化落地提供新路径。
OpenClaw发布新版本:DeepSeek V4Flash正式成为系统默认模型
全球知名开源Agent框架OpenClaw发布新版本,正式将中国开源模型DeepSeek V4Flash设为系统默认大脑。DeepSeek V4凭借强大的MoE架构与百万级上下文窗口,助力OpenClaw在多模态协作、实时语音会议自动化及浏览器自动化等场景实现性能飞跃。此次更新标志着OpenClaw从对话工具向系统级工作流平台的关键转型,进一步巩固了其在全球AI生态中的领先地位。
字节跳动开源DeerFlow2.0 打造中国版超级智能体框架
字节跳动开源超级智能体编排框架DeerFlow2.0,集成多角色协作、插件化工具调用与安全沙盒环境,支持复杂任务自动化,适配中国本地场景,GitHub已获44k星标,被誉为“中国版OpenClaw”,助力开发者高效构建智能体应用。
OpenClaw实现边用边训 智能体强化学习框架AReaL v1.0稳定版发布
蚂蚁集团与清华大学联合发布开源强化学习训练框架AReaL v1.0稳定版,支持智能体一键接入RL训练,无需修改代码即可实现持续优化。该框架通过Proxy Worker中转层简化接入流程,并推出原生训练引擎Archon,支持5D并行训练,大幅降低开发门槛。AReaL还引入AI辅助开发体系,显著提升工程效率,引领下一代AI基础设施工程革新。
智元ACoT-VLA入选CVPR 2026 开源助力AGIBOT挑战赛
智元机器人联合北京航空航天大学推出的ACoT-VLA架构入选CVPR 2026,开创了在动作空间进行推理的思维链范式。该模型通过显式与隐式推理模块的结合,显著提升了机器人在复杂环境下的操控性能,并作为AGIBOT WORLD CHALLENGE的基线模型开源,助力全球开发者推动具身智能技术的发展。
OpenClaw推动AI智能体发展
OpenClaw开源AI智能体框架近期风靡全球,其红色龙虾Logo引人注目。该框架具备全流程执行能力,可实现从交互到主动执行的突破,支持本地优先架构和跨平台共享对话上下文。相关概念股逆势走高,成为市场关注焦点。
个人手搓AI股票分析助手成热潮 全民投研时代将至
文章探讨了个人自建AI股票分析助手的热潮,分析了这一现象背后的技术推动力、主流搭建路径及其与券商AI投顾工具的差异。随着大模型技术门槛降低,普通投资者也能通过本地部署、开源框架等方式快速构建个性化分析工具,实现高效、定制化的投研体验,标志着全民投研时代的可能到来。
输入脚本秒生视频 字节开源StoryMem解决AI角色变脸问题
字节跳动与南洋理工大学联合开源StoryMem框架,通过创新的视觉记忆机制,将单镜头视频扩散模型转化为多镜头长视频故事讲述者。该框架能根据分镜脚本自动生成超过1分钟、角色与场景高度连贯的叙事视频,有效解决AI视频生成中的角色“变脸”和场景跳变问题,适用于广告、影视预制作和短视频创作等领域。
视频AI应用几分钟即可搭建 开源框架VideoPipe简化CV开发
VideoPipe是一款开源视频分析框架,通过创新的管道架构让开发者像搭积木一样快速构建视频AI应用。它支持多源视频流输入、多样化推理引擎,并覆盖从拉流到推流的完整处理链路,极大降低了计算机视觉应用的开发门槛和落地周期。
清华开源TurboDiffusion 实现AI视频秒级生成 提速最高200倍
清华大学TSAIL实验室与生数科技联合推出开源视频生成加速框架TurboDiffusion,通过集成SageAttention、稀疏线性注意力机制和时间步蒸馏技术,在保证视频质量的同时将AI视频生成速度提升100-200倍。实测显示,在RTX5090显卡上生成5秒视频仅需1.9秒,大幅降低了计算延迟和算力需求。该框架已开源并提供多种优化方案,适配消费级和工业级显卡,助力个人创作者与企业提升视频生产效率。