TAG:稀疏注意力

MiniMax M3即将发布:稀疏注意力架构突破 百万Token上下文效率显著提升

MiniMax M3即将发布:稀疏注意力架构突破 百万Token上下文效率显著提升

国内AI公司MiniMax即将发布新一代大模型M3,采用创新的稀疏注意力架构,通过Index Branch和Sparse Branch结合,有效解决百万Token上下文处理的计算瓶颈。相比前代M2,M3在Prefill和Decoding阶段速度分别提升9.7倍和15.6倍,显著降低推理成本,为长文本理解、多文档分析等应用提供高效支撑,推动大模型向效率与实用性转型。

2026-05-27 14:19
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/