TAG:网络架构

无需额外GPU,提升15%算力:大模型圈开始优化网络

无需额外GPU,提升15%算力:大模型圈开始优化网络

文章探讨了大模型行业从依赖增加GPU转向通过优化网络架构来提升算力效率的新趋势。以智谱的ZCube组网架构为例,展示了在不增加硬件的情况下,实现15%的推理吞吐提升和延迟降低;同时,OpenAI等巨头推出的MRC协议进一步强调了网络优化的重要性。这一转向有助于降低成本、提高性能,推动行业从硬件堆砌向系统效率挖掘转变。

2026-05-22 11:10
0
0

智谱联合清华等提出ZCube组网架构,大模型推理吞吐提升15%,网络成本削减三分之一

智谱联合清华等提出ZCube组网架构,大模型推理吞吐提升15%,网络成本削减三分之一

智谱联合清华大学等在ACM SIGCOMM 2025上提出ZCube网络架构,针对大模型推理中的网络瓶颈。该架构采用扁平化设计,取消Spine层交换机,实现流量负载均衡。在GLM-5.1coding生产环境中,ZCube使GPU推理吞吐提升15%,首Token时延降低40.6%,同时网络成本削减33%。这标志着智算基础设施从通用互联向模型流量驱动的系统协同转变,为大规模AI推理提供了高效经济的解决方案。

2026-05-21 11:45
0
0

OpenAI 联合英伟达等巨头发布 MRC 协议,重塑大规模 AI 训练网络架构

OpenAI 联合英伟达等巨头发布 MRC 协议,重塑大规模 AI 训练网络架构

OpenAI联合AMD、博通、英特尔、微软和英伟达等巨头,共同推出多路径可靠连接(MRC)协议,旨在解决大规模AI训练中的网络延迟和故障问题。该协议通过多平面网络设计和自适应数据包喷淋技术,将传统三层架构简化为两层,显著减少组件数量和能耗,实现微秒级故障自愈。MRC协议已在英伟达超级计算机和甲骨文云中应用,标志着AI基础设施向更高效、坚韧的架构转型。

2026-05-07 14:54
47
0

挑战英伟达垄断 初创公司 Upscale 获2亿美元融资 自研芯片瞄准NVSwitch

挑战英伟达垄断 初创公司 Upscale 获2亿美元融资 自研芯片瞄准NVSwitch

AI网络初创公司Upscale AI获得2亿美元A轮融资,旨在打破英伟达在AI系统交换机领域的垄断。其核心产品SkyHammer芯片专为AI工作负载设计,支持UALink等协议,并计划通过开源系统提升兼容性,联合AMD、高通等盟友挑战英伟达的封闭生态。

2026-01-22 13:55
27
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/