TAG:算力优化

旗舰模型需求激增，OpenAI紧急解除GPT-5.6算力限制

旗舰模型需求激增，OpenAI紧急解除GPT-5.6算力限制

OpenAI因GPT-5.6Sol需求在48小时内激增，紧急取消Plus、Pro和Business用户的5小时使用限制，并重置额度以保障编程与智能体工作流。文章解析其背后的算力优化、Token效率提升，以及大模型行业向工程化降本与应用落地转型的趋势。

2026-07-13 15:50

3

·

0

谷歌 Gemini App 月活突破 9 亿一年内翻倍

谷歌 Gemini App 月活突破 9 亿一年内翻倍

谷歌Gemini App月活跃用户在一年内翻倍至9亿，得益于与谷歌搜索、Gmail等13款超10亿用户应用的深度整合。同时，谷歌搜索AI Overviews功能月活突破25亿，加速AI技术普及。通过优化算力成本降低30%以上，提升运营效率。未来计划推出新模型如Gemini3.5Pro，进一步重塑全球AI竞争格局。

2026-06-04 10:48

1

·

0

无需额外GPU，提升15%算力：大模型圈开始优化网络

无需额外GPU，提升15%算力：大模型圈开始优化网络

文章探讨了大模型行业从依赖增加GPU转向通过优化网络架构来提升算力效率的新趋势。以智谱的ZCube组网架构为例，展示了在不增加硬件的情况下，实现15%的推理吞吐提升和延迟降低；同时，OpenAI等巨头推出的MRC协议进一步强调了网络优化的重要性。这一转向有助于降低成本、提高性能，推动行业从硬件堆砌向系统效率挖掘转变。

2026-05-22 11:10

0

·

0

阿里语音大模型获三项第一；智谱发布新成果：不加一块GPU，算力多出15%

阿里语音大模型获三项第一；智谱发布新成果：不加一块GPU，算力多出15%

本文报道了AI领域的三项最新进展：阿里巴巴语音大模型在全球评测中获三项第一，推动语音技术向精准化和场景化发展；智谱发布新架构，在不增加GPU的情况下提升算力15%，体现系统级创新；全国首个家庭通用机器人发布，展示具身智能在生活场景的应用。这些成果加速AI商业化落地，优化算力成本，并拓展智能生活边界。

每日经济新闻

2026-05-22 11:09

0

·

0

Moonshot AI联合清华大学发布PrfaaS架构，破解大模型算力瓶颈

Moonshot AI联合清华大学发布PrfaaS架构，破解大模型算力瓶颈

Moonshot AI与清华大学联合发布了PrfaaS（预填充即服务）架构，旨在破解大模型推理中的算力瓶颈。该架构通过解耦预填充与解码阶段，将计算密集型任务卸载至专用集群，并配合双时间尺度调度机制优化资源利用。实测显示，该方案可提升54%的服务吞吐量并显著降低延迟，为未来跨地域算力网络的构建和AI工业化应用奠定了坚实的技术基础。

2026-04-20 15:33

1

·

0

中国中车与百度智能云合作 10秒AI提速护航春运

中国中车与百度智能云合作 10秒AI提速护航春运

中国中车与百度智能云合作，利用AI大模型技术显著提升高铁研发与运维效率，将原本耗时24小时的仿真计算压缩至10秒，实现从经验主导到数据驱动的研发革新，开启中国智造的新篇章。

2026-03-11 13:45

6

·

0

vLLM团队创立Inferact，估值达8亿美元瞄准全球AI推理市场

vLLM团队创立Inferact，估值达8亿美元瞄准全球AI推理市场

vLLM原班人马创立AI基础设施公司Inferact，以8亿美元估值完成1.5亿美元种子轮融资，旨在通过优化推理引擎技术，大幅降低AI推理成本并提升效率，推动人工智能向实用化阶段迈进。

2026-01-23 15:29

20

·

0

AI竞赛进入成本较量：企业如何应对Token费用挑战

AI竞赛进入成本较量：企业如何应对Token费用挑战

文章探讨了AI大模型产业化进程中Token成本对企业竞争力的关键影响。随着智能体应用普及，Token消耗量呈指数级增长，高昂成本成为制约AI规模化落地的核心瓶颈。文章分析了政策支持、行业数据和技术创新如何共同推动Token成本下降，指出未来AI竞争不仅是技术高低之争，更是成本效率的经济账。

2026-01-02 22:20

35

·

0

源 Yuan3.0Flash 开源多模态大模型引领 AI 新潮流

源 Yuan3.0Flash 开源多模态大模型引领 AI 新潮流

Yuan3.0Flash是一款开源的40B参数多模态基础大模型，采用创新的稀疏混合专家架构，显著降低算力消耗并提升推理准确性。模型支持二次开发，在企业应用中已超越GPT-5.1，在多模态检索和表格理解等任务上表现优异，有效降低AI应用成本。

2025-12-31 17:50

23

·

0

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

2026-05-11

·

0 浏览

多空胶着恒指震荡整理，AI景气外溢主导行情波动

2026-05-11

·

0 浏览

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

2026-05-11

·

0 浏览

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

2026-05-11

·

0 浏览

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

2026-05-11

·

0 浏览

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

2026-05-11

·

0 浏览

4月汽车出口增长51% 国内零售下跌超20%

2026-05-11

·

0 浏览

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

2026-05-11

·

0 浏览

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

2026-05-11

·

0 浏览

申昊科技拟设具身智能子公司加码人形机器人业务

2026-05-11

·

0 浏览

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读

机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台

关注爱力方，掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/

浙ICP备2025176963号-3

标签云 RSS订阅滚动资讯资讯排行