TAG:LLM
硅谷扎堆押注LLM,杨立昆另辟蹊径,JEPA架构能否成为具身智能最优解?
本文基于图灵奖得主杨立昆的深度访谈,探讨了他对当前大语言模型(LLM)技术路线的批评。杨立昆指出LLM的自回归架构限制了推理能力,并提出了以视觉为基础的世界模型作为替代方案。他介绍了JEPA架构,该架构在抽象表示空间中进行预测,旨在实现更高效的具身智能。文章分析了这些观点对AI行业未来发展的潜在影响。
OpenAI联合创始人Andrej Karpathy宣布加入Anthropic,专注于下一代LLM研发
OpenAI联合创始人Andrej Karpathy宣布加入Anthropic,这一人事变动凸显了AI顶级人才向OpenAI挑战者流动的趋势。Karpathy将致力于大型语言模型的底层架构研究,推动LLM作为新型计算机操作系统的愿景。Anthropic凭借Claude3系列模型在性能上已对GPT-4构成威胁,Karpathy的加盟有望加速其技术迭代,重塑AI竞争格局。
Zig 项目全面禁止 LLM 辅助贡献,强调押注于人而非代码并引发热议
文章聚焦 Zig 项目全面禁止 LLM 生成代码或评论参与贡献的争议,解析其背后“重人才培养胜过代码产出”的理念,探讨 AI 编程效率、开源社区信任机制与导师制传承之间的深层冲突。
网易有道云笔记发布“LLM Wiki”套件,聚焦AI时代知识管理升级
网易有道云笔记推出“LLM Wiki”技能套件,以大语言模型重构知识管理:从传统“记录+搜索”的被动检索,升级为能理解、关联、归纳碎片信息的“知识增量编译器”。该方案为个人与企业打造更高效的第二大脑与智能协作办公提供底座。
谷歌 TurboQuant 发布:LLM 键值缓存压缩六倍速度提升八倍 零精度损失无需训练
谷歌研究团队发布全新向量量化算法 TurboQuant,通过 PolarQuant 与 QJL 技术实现 LLM 键值缓存内存压缩6倍、推理速度提升8倍,零精度损失且无需训练。该技术可显著降低 AI 推理成本,推动长上下文应用落地,适用于广泛场景。
ChatGPT驱动40%-60%流量,SEO进入“即时呈现时代”
过去一年 AI 改变搜索已成事实,Previsible 分析 19 个 GA4 属性发现 LLM 驱动流量大增,仅五个月从 17076 次跃至 107100 次,各垂直领域增长显著。重要的是 AI 不在乎传统 SEO 流程,已进入“即时呈现时代”。真实流量数据显示法律、金融等领域占 LLM 驱动会话 55%,各模型表现不同,需跨平台优化内容结构,从“排名”转向“被选中”,应对 LLM 流量激增,SEO 正在进化。