TAG:MoE模型

谷歌联合英伟达发布开源模型DiffusionGemma,引入扩散机制单卡推理提速4倍

谷歌联合英伟达发布开源模型DiffusionGemma,引入扩散机制单卡推理提速4倍

谷歌联合英伟达于2026年6月10日发布实验性开源模型DiffusionGemma,首创将图像扩散机制引入文本生成,打破自回归范式。模型通过从随机噪声迭代优化实现一次性并行输出256个标记,260亿参数MoE架构单步激活仅38亿。在H100上单请求输出速度达每秒1000标记(RTX5090超700),在文本补全、代码填空、数独、氨基酸序列等非线性任务中展现显著优势。权重基于Apache2.0在Hugging Face开源,兼容vLLM、MLX等框架,为AI复杂逻辑生成开辟新路径。

2026-06-11 10:55
0
0

阿里开源Qwen3.6-35B-A3B:30亿激活参数实现编程能力跨越式升级

阿里开源Qwen3.6-35B-A3B:30亿激活参数实现编程能力跨越式升级

阿里千问开源MoE模型Qwen3.6-35B-A3B,以350亿总参数、30亿激活参数实现高效推理,在多项编程基准中超越Qwen3.5-27B并领先前代模型。其多模态与空间感知能力同样突出,已接入Qwen Studio与百炼API,展现“小参数、高智能”在智能体编程落地中的关键价值。

2026-04-17 15:17
25
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/