TAG:小模型

阿里黑科技炸场！0.6B 小模型“魔改”成 17B MoE，激活参数仅 5%，CPU 直接跑 30token/s！

本文介绍阿里国际数字商业团队推出的Marco-Mini-Instruct MoE模型，该模型通过Upcycling技术由0.6B小模型升级为17B总参数规模，激活参数仅5%，CPU上可实现30token/s的推理速度，性能超越4B级Dense模型，为行业提供了低成本、高效率的MoE炼制新路径，大幅降低中小团队落地MoE的门槛。

aibase

2026-04-10 10:53

英伟达小模型成本仅为GPT-5 Pro三十六分之一

英伟达4B小模型NVARC在ARC-AGI2评测中以27.64%的成绩超越GPT-5 Pro，同时单任务成本仅为20美分，远低于对手的7美元。文章详细介绍了其零预训练深度学习方法和创新的合成数据管道，展示了小模型在特定领域的高效适应性和成本优势。

爱力方

2025-12-08 16:28

MIT 创企 Liquid AI 推出企业级小模型训练蓝图LFM2

麻省理工学院创企Liquid AI发布了第二代Liquid Foundation Models（LFM2），这是一种采用创新“liquid”架构的企业级小模型，在设备端提供高速、高效的AI推理能力。LFM2在质量和CPU吞吐量上超越同类模型，支持手机、笔记本电脑等设备上的实时隐私保护应用。公司还公开了详细技术蓝图，帮助其他组织根据自身硬件约束训练定制化高效模型。

爱力方

2025-12-02 17:09

通知

尊敬的用户

user

TAG:小模型

阿里黑科技炸场！0.6B 小模型“魔改”成 17B MoE，激活参数仅 5%，CPU 直接跑 30token/s！

英伟达小模型成本仅为GPT-5 Pro三十六分之一

MIT 创企 Liquid AI 推出企业级小模型训练蓝图LFM2

快讯

AI振兴网络视听每一帧，但人仍是不可替代的灵魂

中国工程院院士郑纬民：从模型服务走向词元服务，是智能体时代对基础设施的必然要求

微软接手OpenAI挪威星际之门项目加码AI算力布局

让AI帮忙买保险结果付款给了陌生人？每经记者亲测：通用AI和保险AI用谁买保险更靠谱

爱奇艺创始人、首席执行官龚宇：期待AI生成的高品质影视作品

激进投资者施压叠加AI效率提升 Snap启动16%裁员计划股价盘前大涨11%

地平线副总裁吕鹏：物理AI时代需打造超级平台，舱驾融合是智能电动2026发展方向

加纳驻华大使携手APUS签署战略合作，启动KOJO BONSU GEN Z AI CLUB

AI时代背景下初高中学习：真人老师与AI工具谁更能提升学习效果

佰维存储Q1净利28.99亿元实现扭亏为盈 AI端侧存储收入增近5倍

推荐专栏

爱力方

机器人大讲堂

user

TAG:小模型

阿里黑科技炸场！0.6B 小模型“魔改”成 17B MoE，激活参数仅 5%，CPU 直接跑 30token/s！

英伟达小模型成本仅为GPT-5 Pro三十六分之一

MIT 创企 Liquid AI 推出企业级小模型训练蓝图LFM2

快讯

AI振兴网络视听每一帧，但人仍是不可替代的灵魂

中国工程院院士郑纬民：从模型服务走向词元服务，是智能体时代对基础设施的必然要求

微软接手OpenAI挪威星际之门项目 加码AI算力布局

让AI帮忙买保险结果付款给了陌生人？每经记者亲测：通用AI和保险AI用谁买保险更靠谱

爱奇艺创始人、首席执行官龚宇：期待AI生成的高品质影视作品

激进投资者施压叠加AI效率提升 Snap启动16%裁员计划 股价盘前大涨11%

地平线副总裁吕鹏：物理AI时代需打造超级平台，舱驾融合是智能电动2026发展方向

加纳驻华大使携手APUS签署战略合作，启动KOJO BONSU GEN Z AI CLUB

AI时代背景下初高中学习：真人老师与AI工具谁更能提升学习效果

佰维存储Q1净利28.99亿元实现扭亏为盈 AI端侧存储收入增近5倍

推荐专栏

爱力方

机器人大讲堂

微软接手OpenAI挪威星际之门项目加码AI算力布局

激进投资者施压叠加AI效率提升 Snap启动16%裁员计划股价盘前大涨11%