TAG:模型优化

DeepSeek 发布突破性研究：架构优化显著提升AI推理能力

DeepSeek最新研究揭示，通过优化神经网络架构而非单纯扩大模型规模，可显著提升大语言模型的推理能力。其提出的“流形约束超连接”方法解决了信号传播不稳定问题，在多项基准测试中实现性能突破，同时仅增加约6%-7%的训练开销，为AI发展提供了高效且经济的新路径。

aibase

2026-01-04 17:45

DeepSeek双模型重磅开源长文本与深度思考能力再突破

DeepSeek发布V3.2双模型，标准版在128k上下文场景下与GPT-5互有胜负，深度思考版在多项基准测试中与Gemini3Pro打平。核心升级转正稀疏注意力（DSA）将长文本计算复杂度降至线性，显存占用下降40%，推理速度提升2.2倍，首次实现开源模型百万token单卡推理。模型已开源并允许商业化，下一步将开源DSA内核与RL训练框架，推动开源阵营在长文本与推理能力上冲击领先地位。

aibase

2025-12-03 10:40

清华新发现：AI大模型不止看“块头”，更要重视密度

清华大学在《自然・机器智能》发表研究，提出AI大模型评估新概念“能力密度”，强调不应仅关注参数规模，而需重视每个参数的智能水平。研究发现能力密度正以每3.5个月翻倍的速度增长，未来小体积模型将实现更高性能。这项突破推动AI向精炼高效发展，已成功应用于手机、汽车等智能设备领域。

爱力方

2025-11-24 11:36

通知

尊敬的用户

user

TAG:模型优化

DeepSeek 发布突破性研究：架构优化显著提升AI推理能力

DeepSeek双模型重磅开源长文本与深度思考能力再突破

清华新发现：AI大模型不止看“块头”，更要重视密度

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

多空胶着恒指震荡整理，AI景气外溢主导行情波动

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

4月汽车出口增长51% 国内零售下跌超20%

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

申昊科技拟设具身智能子公司加码人形机器人业务

推荐专栏

爱力方

机器人大讲堂

user

TAG:模型优化

DeepSeek 发布突破性研究：架构优化显著提升AI推理能力

DeepSeek双模型重磅开源 长文本与深度思考能力再突破

清华新发现：AI大模型不止看“块头”，更要重视密度

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

多空胶着恒指震荡整理，AI景气外溢主导行情波动

宠物AI公司PurrPurr获阿尔法公社投资 首年GMV目标5000万

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

4月汽车出口增长51% 国内零售下跌超20%

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

港股复盘：强势翻红 芯片概念股冲高回落 短期风险需警惕

申昊科技拟设具身智能子公司 加码人形机器人业务

推荐专栏

爱力方

机器人大讲堂

DeepSeek双模型重磅开源长文本与深度思考能力再突破

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

申昊科技拟设具身智能子公司加码人形机器人业务