TAG:开源模型
从平面修图到空间重塑:京东开源图像模型JoyAI-Image-Edit重新定义AI编辑
京东探索研究院正式开源JoyAI-Image-Edit图像模型,引领AI修图迈向“空间智能”新阶段。该模型通过深度建模三维空间,实现了对相机视角、物体位移及缩放的精准控制,并全面兼容15类通用编辑需求。其出色的几何一致性与物理规律理解力,为电商生产、创意设计及具身智能等领域提供了强大的底层技术支撑。
谷歌Gemma 4全面开源 小模型展现超强AI能力
谷歌近日重磅开源Gemma4系列模型,标志着人工智能领域的重要突破。该系列模型以其小参数量却展现出超强AI能力而引人注目,其中一款仅3.8亿参数便能超越体量20倍的大模型,让强大AI轻松部署至手机和轻薄本。Gemma4通过底层架构创新,提升计算效率,并特别优化移动设备和物联网终端应用。它在多项行业标准测试中表现卓越,涵盖文本生成、数学推导和代码编写。Gemma4采用Apache2.0许可证,支持灵活部署,为开发者构建智能应用提供了开放高效的环境。
谷歌发布开源模型Gemma4 采用Apache许可证助力开发者
谷歌正式发布了其新一代开源AI模型Gemma4,标志着其在开源策略上的重大转变。该模型采用业界公认的Apache 2.0许可证,赋予开发者更大的自由度,可无顾虑地使用、修改和分发,尤其利于商业化应用。Gemma4在技术架构上实现了性能飞跃,能够处理更复杂的开发任务。同时,其与现有开发者生态系统(如Android)的高度兼容性,极大降低了技术门槛,使得中小型企业也能轻松部署高质量的AI解决方案,彻底释放开发者生产力。
Cloudflare弃闭源转Kimi K2.5 降本增效再突破
Cloudflare 宣布采用开源模型 Kimi K2.5 替代闭源方案,实现77%成本削减的同时保持高性能。该模型在编程和 Agent 任务中表现卓越,为全球科技企业提供了降本增效的典范。
阿里通义开源影视级配音模型Fun-CineForge 解决音画同步问题
阿里通义实验室发布开源影视级配音大模型Fun-CineForge,首次引入时间模态概念,攻克音画不同步、情感表达缺失等难题。支持复杂场景下的精准配音,配套CineDub数据集构建流程显著降低标注成本,已在GitHub、HuggingFace和魔搭社区上线,推动AI语音技术向影视后期制作迈进。
通义开源首个影视级配音大模型 AI实现情感化语音
阿里通义实验室开源全球首个影视级配音大模型Fun-CineForge,突破AI配音机械感瓶颈,实现情感化表达和多场景音效还原。该模型采用创新一体化设计,配套开放高质量数据集构建方法,为影视创作者提供低成本高质量配音解决方案。
腾讯清华联手推出SongGeneration 2 音素错误率仅8.55%
腾讯与清华大学联合发布的SongGeneration 2音乐基础模型在AI音乐领域实现重大突破,音素错误率低至8.55%,超越主流商业模型。该模型采用创新的LLM-扩散混合架构,支持多语种生成,并在消费级硬件上流畅运行,标志着AI音乐正式进入商业级应用阶段。
阿里Qwen人事变动风波
文章报道了阿里通义千问(Qwen)大模型团队核心人物林俊旸及其多名核心成员在48小时内相继离职的事件,并深入分析了其背后的原因,包括组织架构调整、商业化与前沿研究的矛盾、以及阿里集团对AI战略的重新定位。文章还探讨了此次人事震荡对开源策略和AI人才竞争的影响。
Notion联手国产AI推出开源模型 重塑工作流主打性价比
Notion宣布引入首个开源权重模型MiniMax M2.5,打破闭源模型垄断,为全球用户提供高性价比AI选择。该模型针对智能体工作流优化,在文档处理、任务自动化等场景中表现卓越,成本远低于闭源模型,标志着国产大模型进入全球主流生产力工具核心。
阿里AI业务整合 千问统一大模型品牌
阿里巴巴宣布将AI业务品牌统一为“千问”,整合基础与专业模型,并推出千问APP作为旗舰应用。千问3.5开源模型在Hugging Face平台获得极高评价,春节期间APP处理近2亿次指令,日活用户增长显著。通义实验室的成立进一步强化了AI研发架构,助力阿里巴巴在人工智能领域持续创新。
Notion 集成 MiniMax M2.5 打造高性价比 AI 办公生态
Notion宣布在其AI自动化工具中引入国产开源模型MiniMax M2.5,与Claude、GPT等闭源模型共同服务全球用户。此举标志着生产力工具向“高性能闭源+高性价比开源”混合生态转型,为用户提供更具经济性的AI办公解决方案,降低企业AI应用门槛,并凸显国产模型在国际生态中的协同价值。
阿里巴巴大模型更名千问 品牌矩阵全面整合
阿里巴巴宣布将AI业务核心品牌统一为“千问”,涵盖大模型和C端应用,标志着其AI战略的进一步聚焦。千问大模型在技术层面表现强劲,Qwen3.5系列包揽全球开源榜单前四,市场数据也显示千问APP用户活跃度大幅增长,展现出向国民级AI助手演进的势头。此次品牌整合旨在强化其在开源生态与C端市场的领导地位,重塑行业竞争格局。
阿里云上线开源模型编程订阅服务 存储芯片涨价或持续全年
阿里云推出编程模型订阅服务,整合四款开源模型API,降低开发者接入成本;存储芯片因AI需求预计全年涨价,中国存储产业加速发展;四川出台政策扩容算力券,探索场景券和模型券,全面支持AI产业发展。
小米机器人新突破:视觉语言理解与实时执行双升级
雷军宣布小米机器人团队开源Xiaomi-Robotics-0模型,该模型具备视觉语言理解与高性能实时执行能力,在Libero、Calvin和SimplerEnv等主流测试集中均取得最优成绩,展示了小米在具身智能领域的领先技术布局。
具身智能取得新进展 达摩院开源RynnBrain登顶16项全球榜单
阿里巴巴达摩院开源了具身智能大脑基础模型RynnBrain,包含7个全系列模型,其中30B MoE规模模型首次赋予机器人时空记忆与空间推理能力,显著提升智能交互水平。该模型在16项全球评测榜单中刷新纪录,超越国际顶尖模型,旨在降低研发门槛,加速机器人在工业及服务场景的应用。