TAG:开源
小红书开源训练引擎Relax,拓展AI训练基础设施布局
小红书AI平台团队开源大模型强化学习训练引擎Relax,面向全模态与Agentic场景,支持文本、图像、音频、视频统一接入。其模态感知并行与端到端异步流水机制提升训练效率与扩展性。此次开源体现小红书AI工程积累,并借技术贡献布局开发者生态。
国产大模型 MiniMax 2.7 确认本周开源:Token 成本将进一步下探
国产大模型MiniMax 2.7宣布将于本周末开源,旨在显著降低开发者的Token词元费用。该模型在软件工程领域表现出色,SWE-Pro基准测试得分接近顶尖模型水平,擅长Bug分析、代码安全及项目交付。同时,MiniMax 2.7深度适配办公场景,大幅提升Excel、PPT、Word的复杂编辑能力,长文本技能遵循率高达97%。它还具备优秀的身份一致性。此次开源不仅打破了第三方平台接入限制,更将为开发者带来更具性价比的词元费用和媲美Sonnet 4.6的性能,预示着国产大模型的“普惠时刻”到来,助力全球开发
美团发布多模态模型LongCat-Next 视觉语音底层统一
本文介绍美团4月3日发布的原生多模态大模型LongCat-Next,其依托DiNA架构实现图文音模态底层统一,在多项测试中性能超越专用模型,已全面开源,可为开发者研发能感知真实世界的AI提供核心技术支持。
AI巨头LiteLLM弃用争议插件Delve
LiteLLM宣布移除争议插件Delve,以回应社区对数据隐私和透明度的质疑。此举旨在重建用户信任,并转向更透明的开源方案,揭示了AI中间层在效率与安全间的冲突。
蚂蚁灵波开源2.7T深度数据集 含200万真实样本覆盖6款相机
蚂蚁灵波科技开源LingBot-Depth-Dataset,包含300万对RGB-D深度数据样本(200万真实场景+100万渲染),总规模2.71TB,覆盖6款主流深度相机。这是目前开源社区中规模最大的真实场景RGB-D数据集,将为具身智能、空间感知和三维视觉研究提供高质量数据支持,有效提升模型在真实环境中的应用性能。
企业微信CLI开源 开放七大核心能力兼容主流AI Agent
企业微信 CLI 正式开源,开放消息、日程、文档等七大核心能力,支持主流 AI Agent 直接调用。该项目优先面向小微企业,提供高效办公场景支持,显著提升任务执行准确度并降低 Token 消耗成本,加速企业办公智能化转型。
微软开源语音AI VibeVoice 单次处理90分钟多说话人对话 GitHub获27K星
微软开源了前沿语音AI家族VibeVoice,包含自动语音识别(ASR)和文本转语音(TTS)模型,支持长达90分钟的多说话人对话处理,GitHub已获27K Star。项目采用MIT许可,支持本地部署,无需云端费用,为语音合成领域带来创新突破。
企业微信CLI开源 支持AI调用7大功能
腾讯企业微信 CLI 正式开源,赋予 AI 7 大核心能力权限,包括日程管理、会议发起、文档编辑等,实现 AI 与办公生态的深度集成。开发者可通过标准化接口构建私有化智能体,降低 Agent 开发门槛,助力企业实现智能化办公。
蚂蚁灵波亮相中关村论坛 开源机器人基座助力智能产业
蚂蚁灵波科技在中关村论坛上展示了其在具身智能领域的最新进展,聚焦机器人“大脑基座”模型的开源与产业化落地。首席科学家沈宇军强调通过基础模型降低场景开发成本,推动行业协同创新。文章详细介绍了蚂蚁灵波的模型布局,包括VLA、VA等核心技术,以及开源策略对产业发展的积极影响。
95后AI天才少女罗福莉最新发声
95后AI新锐罗福莉在2026中关村论坛上畅谈OpenClaw框架的革命性价值,强调开源与Agent智能体层的潜力。她指出,大模型未来将迈向长上下文、高效推理时代,推动算力、芯片乃至能源层面的新竞争。作为小米MiMo大模型负责人,她展望大模型‘进化’趋势,并揭示自迭代能力实现的可行路径。
AI2推出开源代理MolmoWeb 仅靠视觉即可操控网页
艾伦人工智能研究所(AI2)发布全开源网络代理MolmoWeb,通过视觉驱动技术仅凭屏幕截图即可操控网页,性能超越传统代理。8B版本在WebVoyager测试中得分78.2%,接近OpenAI专有模型,并开源了包含3.6万次浏览任务的MolmoWebMix数据集。
清华开源OpenMAIC 打造AI多智能体虚拟课堂 一键生成沉浸式互动教室
清华大学开源OpenMAIC多智能体互动课堂平台,通过大语言模型驱动,将任意主题或文档转化为沉浸式学习体验。该平台支持AI老师、助教和同学多角色协作,一键生成完整课程,包括讲义、测验、实验和项目任务,极大提升互动性和陪伴感。OpenMAIC已在GitHub开源,为AI教育领域带来重大创新。
Meta推迟Llama4发布至5月 技术优化待完善
Meta宣布将新一代大语言模型Llama4的发布时间推迟至5月,原因是研发团队在性能微调和逻辑推理优化方面遇到技术挑战。此次推迟反映了顶级大模型研发的复杂性,但Meta仍坚持开源战略,并计划推出多个版本以满足不同需求。
OpenClaw持续火爆 算力需求或将暴涨
OpenClaw作为开源AI智能体,凭借其持久记忆和主动执行能力,成为国内主流云厂商竞相接入的焦点。其Token消耗升级为机器自循环,有望带动海量算力需求,推动AI产业进入Agent时代。
阿里发布新一代通义千问3.5
阿里巴巴开源新一代大模型千问Qwen3.5-Plus,采用创新的底层架构,总参数3970亿但激活仅170亿,性能超越万亿参数模型,部署显存占用降低60%,推理吞吐量提升高达19倍,API价格低至每百万Token 0.8元,已接入千问APP和PC端,开发者可通过魔搭社区、HuggingFace或阿里云百炼获取。