TAG:算力优化
Moonshot AI联合清华大学发布PrfaaS架构,破解大模型算力瓶颈
Moonshot AI与清华大学联合发布了PrfaaS(预填充即服务)架构,旨在破解大模型推理中的算力瓶颈。该架构通过解耦预填充与解码阶段,将计算密集型任务卸载至专用集群,并配合双时间尺度调度机制优化资源利用。实测显示,该方案可提升54%的服务吞吐量并显著降低延迟,为未来跨地域算力网络的构建和AI工业化应用奠定了坚实的技术基础。
中国中车与百度智能云合作 10秒AI提速护航春运
中国中车与百度智能云合作,利用AI大模型技术显著提升高铁研发与运维效率,将原本耗时24小时的仿真计算压缩至10秒,实现从经验主导到数据驱动的研发革新,开启中国智造的新篇章。
vLLM团队创立Inferact,估值达8亿美元瞄准全球AI推理市场
vLLM原班人马创立AI基础设施公司Inferact,以8亿美元估值完成1.5亿美元种子轮融资,旨在通过优化推理引擎技术,大幅降低AI推理成本并提升效率,推动人工智能向实用化阶段迈进。
AI竞赛进入成本较量:企业如何应对Token费用挑战
文章探讨了AI大模型产业化进程中Token成本对企业竞争力的关键影响。随着智能体应用普及,Token消耗量呈指数级增长,高昂成本成为制约AI规模化落地的核心瓶颈。文章分析了政策支持、行业数据和技术创新如何共同推动Token成本下降,指出未来AI竞争不仅是技术高低之争,更是成本效率的经济账。
源 Yuan3.0Flash 开源多模态大模型引领 AI 新潮流
Yuan3.0Flash是一款开源的40B参数多模态基础大模型,采用创新的稀疏混合专家架构,显著降低算力消耗并提升推理准确性。模型支持二次开发,在企业应用中已超越GPT-5.1,在多模态检索和表格理解等任务上表现优异,有效降低AI应用成本。
长视频的尽头是AI?爱奇艺AI转型引发争议,技术重塑内容生产边界何在
2026-04-22
0 浏览
【明日主题前瞻】AI基础设施投资持续升温,带动光纤光缆需求高速增长
2026-04-22
0 浏览
港股风向标:恒指震荡回调坚守26000点,泛AI主线走出独立行情
2026-04-22
0 浏览
从“直觉驱动”到“AI赋能”:ABeam AI解决方案助力企业冷静评估海外客户,探寻更优出海选择
2026-04-22
0 浏览
奔图科技战略升级聚焦技术驱动,首发AI打印一体机推动智能化升级
2026-04-22
0 浏览
睿尔曼亮相FAIR plus 2026:以可靠硬件与批量交付能力夯实“真·干活”机器人产业生态圈
2026-04-22
0 浏览
Tacchi 2.0发布:低计算成本的视觉触觉动态接触仿真器
2026-04-22
0 浏览
谷歌发布多款新AI工具与功能更新
2026-04-22
0 浏览
Agent-World搭建1978个真实场景 助力智能体落地规避训练造假问题
2026-04-22
0 浏览
古尔曼揭秘苹果内部会议:库克身体健康 特努斯冀AI重塑产品版图
2026-04-22
0 浏览