TAG:AI研究
前OpenAI安全VP翁荔发布长文分析Scaling Laws,指出模型可能使用错误数据
前OpenAI安全研究副总裁翁荔在停更13个月后发表逾万字长文,深入拆解支撑大模型行业的Scaling Laws。文章追溯了从Kaplan到Chinchilla的行业共识演变,揭示当前模型训练数据配比可能从一开始就存在偏差,并探讨数据枯竭和Scaling Laws的工程敏感性,为AI从业者提供了关键反思和未来挑战。
AI的无人区在哪?40多位优秀青年学者齐聚南澳岛抛出8个灵魂拷问
近日,南澳科学会议聚焦AI基础逻辑与交叉赋能,汇聚40多位青年学者,通过跨界研讨提出8个直击Math4AI领域‘无人区’的核心科学问题,涵盖AI架构设计、智能涌现、多模态前沿等方向。这些问题旨在推动人工智能与数学的交叉创新,为全球科研提供先导指引,培养颠覆性人才,并彰显粤港澳大湾区在基础研究中的平台作用。
黄仁勋夫妇基金会捐赠 1.08 亿美元算力,助力科研机构 AI 研究
黄仁勋夫妇基金会捐赠价值1.083亿美元的算力资源,支持大学和非营利研究机构的AI研究。这些资源来自CoreWeave,并包括英伟达提供的免费工程技术服务,以优化模型训练效率。此举不仅促进前沿科学实验,还反映了英伟达与CoreWeave的商业合作,包括股权投资和云计算协议。
Kimi杨植麟称大模型训练迈入AI主导研究第三阶段
月之暗面创始人杨植麟在中关村论坛年会上指出,大模型训练已进入由AI主导研究的第三阶段,标志着从人工标注向高度自动化自我进化的范式转移。文章详细介绍了大模型演进的三个阶段,并展望了AI研发效率的指数级加速趋势。
AI测试过度侧重编程 忽视九成真实劳动力需求
卡内基梅隆大学与斯坦福大学的最新研究指出,当前AI智能体测试过于集中在编程领域,忽视了92%的非编程劳动力市场需求。研究发现现有基准测试严重偏向编程任务,而管理、法律等高数字化职业的测试占比极低。专家呼吁AI测评应向更广泛的经济领域扩展,以充分发挥AI的生产力价值。
苹果论文再掀波澜 Qwen3-Coder特调后UI生成能力超越GPT5
苹果UICoder团队最新研究论文展示了如何通过专家级反馈微调开源模型Qwen3-Coder,在UI生成领域超越GPT-5。该研究利用21位资深设计师的深度逻辑注释构建奖励模型,仅用181个高质量草图反馈就实现了性能突破,揭示了专家反馈在AI训练中的关键作用,并探讨了审美主观性与AI设计工具的未来潜力。
谷歌推出Gemini研究助手,AI竞争加剧
谷歌发布全新Gemini深度研究助手,基于Gemini 3 Pro构建,能够进行长时间推理和复杂数据分析,减少幻觉现象,提供更准确报告。该系统可应用于金融服务、生物技术等领域,并允许开发者将研究能力嵌入自有应用。同日OpenAI推出GPT-5.2,标志着AI竞争进一步升级。
清华新发现:AI大模型不止看“块头”,更要重视密度
清华大学在《自然・机器智能》发表研究,提出AI大模型评估新概念“能力密度”,强调不应仅关注参数规模,而需重视每个参数的智能水平。研究发现能力密度正以每3.5个月翻倍的速度增长,未来小体积模型将实现更高性能。这项突破推动AI向精炼高效发展,已成功应用于手机、汽车等智能设备领域。
Databricks联创Konwinski警告:美国AI研究优势正在流失
Databricks联合创始人Andy Konwinski在Cerebral Valley AI Summit上警告,美国正将AI研究主导权让给中国,这对民主制度构成生存级威胁。他指出过去一年约半数值得关注的AI新思路来自中国团队,批评美国头部实验室高价挖走学术人才却将核心模型闭源,导致科学家自由交流传统枯竭。Konwinski呼吁通过政策激励和资金扶持恢复美国学术界与产业界的开放协作。
Meta首席AI科学家Yann LeCun或将离职创立世界模型研究公司
据《金融时报》报道,Meta首席AI科学家、图灵奖得主Yann LeCun计划离职创办新公司,专注于世界模型研究。世界模型是一种能够理解环境并模拟因果关系的AI系统,目前谷歌DeepMind等机构也在积极开发。这一变动正值Meta重组AI部门、应对OpenAI等竞争对手之际,而LeCun对当前大型语言模型的过度宣传持保留态度,认为AI技术仍需实质性突破。