TAG:MoE架构

腾讯发布混元3.0大模型,编程能力大幅提升

腾讯发布混元3.0大模型,编程能力大幅提升

腾讯近日推出新一代AI大模型混元3.0(Hy3),核心编程能力实现飞跃,在SWE-Bench测试中性能提升超40%。该模型采用MoE架构,具备262K长上下文处理能力及高效推理速度,性能逼近国内顶尖水平。混元3.0的发布标志着腾讯在AI研发上的重大突破,为开发者提供了更强力的工具,进一步加剧了大模型市场的竞争。

2026-04-23 16:20
0
0

国产大模型Qwen3.6-35B-A3B正式开源,聚焦高效率与多模态思考能力提升

国产大模型Qwen3.6-35B-A3B正式开源,聚焦高效率与多模态思考能力提升

国产大模型Qwen3.6-35B-A3B正式开源,该模型采用创新的MoE架构,实现350亿总参数下仅需激活30亿参数的极致推理效率。其在编程、Agent任务及多模态思考方面表现优异,尤其在空间分析和复杂逻辑处理上极具优势,且已深度兼容主流Agent框架,是开发者本地部署高性能AI底座的理想选择。

2026-04-20 17:02
0
0

腾讯混元2.0内测启动,406B参数号称推理性能国内领先

腾讯混元2.0内测启动,406B参数号称推理性能国内领先

腾讯发布新一代自研大模型混元2.0,总参数达406B,采用MoE架构提升推理速度,在数学、代码等复杂任务上表现突出,支持256K长上下文窗口。模型已在腾讯云API及元宝、ima等应用灰度上线,并计划于2026年开源,推动国产大模型生态发展。

爱力方 2025-12-08 11:22
10
0

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K,混合注意力+MoE架构重塑长文本编程效率

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K,混合注意力+MoE架构重塑长文本编程效率

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K,采用混合线性注意力机制和MoE稀疏架构,仅激活6.1B参数即可媲美40B密集模型性能。该模型原生支持128K上下文窗口,可扩展至512K,在代码生成和长文本编程任务中实现SOTA表现,推理速度提升3倍以上,为开发者提供高效AI编程解决方案。

2025-10-28 17:46
11
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/