TAG:网络架构
无需额外GPU,提升15%算力:大模型圈开始优化网络
文章探讨了大模型行业从依赖增加GPU转向通过优化网络架构来提升算力效率的新趋势。以智谱的ZCube组网架构为例,展示了在不增加硬件的情况下,实现15%的推理吞吐提升和延迟降低;同时,OpenAI等巨头推出的MRC协议进一步强调了网络优化的重要性。这一转向有助于降低成本、提高性能,推动行业从硬件堆砌向系统效率挖掘转变。
智谱联合清华等提出ZCube组网架构,大模型推理吞吐提升15%,网络成本削减三分之一
智谱联合清华大学等在ACM SIGCOMM 2025上提出ZCube网络架构,针对大模型推理中的网络瓶颈。该架构采用扁平化设计,取消Spine层交换机,实现流量负载均衡。在GLM-5.1coding生产环境中,ZCube使GPU推理吞吐提升15%,首Token时延降低40.6%,同时网络成本削减33%。这标志着智算基础设施从通用互联向模型流量驱动的系统协同转变,为大规模AI推理提供了高效经济的解决方案。
OpenAI 联合英伟达等巨头发布 MRC 协议,重塑大规模 AI 训练网络架构
OpenAI联合AMD、博通、英特尔、微软和英伟达等巨头,共同推出多路径可靠连接(MRC)协议,旨在解决大规模AI训练中的网络延迟和故障问题。该协议通过多平面网络设计和自适应数据包喷淋技术,将传统三层架构简化为两层,显著减少组件数量和能耗,实现微秒级故障自愈。MRC协议已在英伟达超级计算机和甲骨文云中应用,标志着AI基础设施向更高效、坚韧的架构转型。
挑战英伟达垄断 初创公司 Upscale 获2亿美元融资 自研芯片瞄准NVSwitch
AI网络初创公司Upscale AI获得2亿美元A轮融资,旨在打破英伟达在AI系统交换机领域的垄断。其核心产品SkyHammer芯片专为AI工作负载设计,支持UALink等协议,并计划通过开源系统提升兼容性,联合AMD、高通等盟友挑战英伟达的封闭生态。
美股三大指数震荡整理,芯片股走高,光通信板块大涨
2026-05-11
0 浏览
多空胶着恒指震荡整理,AI景气外溢主导行情波动
2026-05-11
0 浏览
宠物AI公司PurrPurr获阿尔法公社投资 首年GMV目标5000万
2026-05-11
0 浏览
隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中
2026-05-11
0 浏览
中国品牌市占率达75%,4月我国汽车销量约252.6万辆,新能源汽车出口贡献度近五成
2026-05-11
0 浏览
4月汽车出口增长51% 国内零售下跌超20%
2026-05-11
0 浏览
4月全国新能源汽车渗透率历史首次突破60%,燃油车零售同比暴跌37%
2026-05-11
0 浏览
港股复盘:强势翻红 芯片概念股冲高回落 短期风险需警惕
2026-05-11
0 浏览
申昊科技拟设具身智能子公司 加码人形机器人业务
2026-05-11
0 浏览