TAG:LLM加速

英伟达发布Nemotron-Labs-TwoTower扩散语言模型 性能提升超两倍

英伟达发布Nemotron-Labs-TwoTower扩散语言模型 性能提升超两倍

英伟达正式开源Nemotron-Labs-TwoTower扩散语言模型,采用创新双塔架构(冻结上下文塔+去噪器塔),在保持98.7%生成质量的前提下,实现生成吞吐量2.42倍提升。该模型支持扩散、模拟AR和标准AR三种解码模式,完全开源支持商业用途,为大规模文本合成与大模型推理加速提供高效新方案。

2026-07-01 17:45
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/