TAG:性能优化

国产多模态大模型 MiniMax M3 正式开源，响应速度倍增

稀宇科技MiniMax正式开源其原生多模态旗舰模型M3，该模型拥有428B总参数，是行业内首个从底层训练初期即进行多模态混合训练的开源大模型。发布后迅速在全球综合智能指数排行榜上斩获开源模型第一，响应速度从30 TPS优化至80 TPS。M3在编码与智能体能力评测中表现顶尖，能自主拆解复杂任务并调用工具，输出代码可直接交付，显著提升开发者生产力，标志着国产多模态大模型的重要里程碑。

aibase

2026-06-16 12:48

Perplexity推出“搜索即代码”，打破僵化API，让AI智能体自主编写搜索管道

Perplexity推出‘搜索即代码’（SaC）新架构，打破传统搜索API的僵化限制，让AI智能体能动态编写和执行自定义搜索工作流程。通过三层核心设计，SA C使AI并行处理查询、过滤无关信息，高效提取结果，显著提升任务性能。在CVE漏洞研究测试中，该架构节省了85%的Token消耗，并在多项基准测试中表现突出，为解决AI搜索智能体的行业痛点提供了创新方案。

aibase

2026-06-08 11:10

MiniCPM-V 4.6 重新定义端侧多模态巅峰，搭载1.3B模型

面壁智能联合清华大学发布MiniCPM-V4.6，一个仅1.3B参数的端侧多模态大模型。它在多项评测中表现卓越，性能直逼更大模型，同时优化了推理速度和资源占用，支持主流设备运行。通过LLaVA-UHD v4技术降低开销，并开源适配多种框架，已在汽车、智能家居等领域落地，推动端侧AI普及。

aibase

2026-05-27 14:43

智谱联合清华等提出ZCube组网架构，大模型推理吞吐提升15%，网络成本削减三分之一

智谱联合清华大学等在ACM SIGCOMM 2025上提出ZCube网络架构，针对大模型推理中的网络瓶颈。该架构采用扁平化设计，取消Spine层交换机，实现流量负载均衡。在GLM-5.1coding生产环境中，ZCube使GPU推理吞吐提升15%，首Token时延降低40.6%，同时网络成本削减33%。这标志着智算基础设施从通用互联向模型流量驱动的系统协同转变，为大规模AI推理提供了高效经济的解决方案。

aibase

2026-05-21 11:45

Moonshot AI与清华大学提出跨数据中心PrfaaS创新架构

本文介绍了 Moonshot AI 与清华大学提出的 PrfaaS（预填充即服务）架构：将大模型推理中的预填充与解码阶段跨数据中心解耦，借助专用计算集群与以太网传输 KVCache，突破传统同中心部署瓶颈。研究显示该方案可将吞吐量提升54%，并通过分层路由与双时间尺度调度降低延迟、提升资源利用率。

aibase

2026-04-20 10:51

更轻快更智能 Codepilot 0.39.0发布重构上下文处理底层逻辑

Codepilot 0.39.0版本发布，重点优化底层性能与用户交互体验。新版本引入统一上下文层，简化处理流程并提升响应速度，同时增强Bridge功能，支持CLI工具上下文注入。交互界面升级包括计划模式状态持久化、侧边栏菜单精简和窄屏显示修复，为开发者提供更高效稳定的AI编程辅助环境。

aibase

2026-03-25 11:19

通知

尊敬的用户

user

TAG:性能优化

国产多模态大模型 MiniMax M3 正式开源，响应速度倍增

Perplexity推出“搜索即代码”，打破僵化API，让AI智能体自主编写搜索管道

MiniCPM-V 4.6 重新定义端侧多模态巅峰，搭载1.3B模型

智谱联合清华等提出ZCube组网架构，大模型推理吞吐提升15%，网络成本削减三分之一

Moonshot AI与清华大学提出跨数据中心PrfaaS创新架构

更轻快更智能 Codepilot 0.39.0发布重构上下文处理底层逻辑

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

多空胶着恒指震荡整理，AI景气外溢主导行情波动

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

4月汽车出口增长51% 国内零售下跌超20%

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

申昊科技拟设具身智能子公司加码人形机器人业务

推荐专栏

爱力方

机器人大讲堂

user

TAG:性能优化

国产多模态大模型 MiniMax M3 正式开源，响应速度倍增

Perplexity推出“搜索即代码”，打破僵化API，让AI智能体自主编写搜索管道

MiniCPM-V 4.6 重新定义端侧多模态巅峰，搭载1.3B模型

智谱联合清华等提出ZCube组网架构，大模型推理吞吐提升15%，网络成本削减三分之一

Moonshot AI与清华大学提出跨数据中心PrfaaS创新架构

更轻快更智能 Codepilot 0.39.0发布 重构上下文处理底层逻辑

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

多空胶着恒指震荡整理，AI景气外溢主导行情波动

宠物AI公司PurrPurr获阿尔法公社投资 首年GMV目标5000万

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

4月汽车出口增长51% 国内零售下跌超20%

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

港股复盘：强势翻红 芯片概念股冲高回落 短期风险需警惕

申昊科技拟设具身智能子公司 加码人形机器人业务

推荐专栏

爱力方

机器人大讲堂

更轻快更智能 Codepilot 0.39.0发布重构上下文处理底层逻辑

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

申昊科技拟设具身智能子公司加码人形机器人业务