TAG:机器学习

哈佛教授两周内将AI Claude培养成物理系研二学生

哈佛教授两周内将AI Claude培养成物理系研二学生

哈佛大学教授Schwartz仅用两周时间,通过深度指导将AI模型Claude培养成具备物理研二水平的研究员。实验展示AI在任务拆解、论文迭代与双线协同中的强大能力,标志着科研进入人类定方向、AI主执行的‘自动驾驶’新时代。

2026-03-26 11:23
0
0

世界模型走向轻量化?LeCun团队与清华团队提出两条路径

世界模型走向轻量化?LeCun团队与清华团队提出两条路径

本文聚焦世界模型领域的两项前沿进展:Yann LeCun团队提出的LeWorldModel通过简化JEPA框架实现从像素端到端训练,大幅降低复杂度并验证物理结构编码能力;清华大学团队的Fast-WAM则挑战传统WAM范式,提出测试阶段无需显式未来想象的高效替代方案。两篇工作从不同角度推动世界模型向更简洁、高效演进,为具身智能发展提供新思路。

2026-03-24 18:31
0
0

密歇根斯坦福联手Figure AI推出机器人记忆基准RoboMME

密歇根斯坦福联手Figure AI推出机器人记忆基准RoboMME

密歇根大学、斯坦福大学与Figure AI联合发布机器人记忆基准RoboMME,首次系统性地将机器人记忆能力划分为时间、空间、物体和程序四大维度,涵盖16项任务与770k高质量时序数据。该基准强制机器人进行历史依赖推理,破解传统评估碎片化难题,并通过14种VLA模型对比揭示不同记忆表征的适用场景,推动具身智能向更复杂现实任务迈进。

2026-03-15 21:45
0
0

VLA技术路线能否成功?

VLA技术路线能否成功?

本文探讨了视觉语言动作模型(VLA)在机器人领域的发展前景与挑战。文章分析了VLA面临的核心问题,包括机器人数据采集的规模限制、仿真与现实的差距、暴力堆参数方法的局限性,以及VLA与成熟视觉语言模型(VLM)在输出空间、反馈机制和时序依赖上的本质差异。通过深入剖析数据鸿沟、物理因果需求和技术瓶颈,引发了对VLA技术路线可行性的关键思考。

机器人大讲堂 2026-02-24 10:21
21
0

京东发布 JoyAI-LLM-Flash 大模型,引领AI技术突破

京东发布 JoyAI-LLM-Flash 大模型,引领AI技术突破

京东于2月14日在Hugging Face平台开源了其最新大模型JoyAI-LLM-Flash,该模型总参数48亿,采用混合专家架构,支持128K上下文长度。通过创新的FiberPO优化框架和Muon优化器,解决了模型扩展的不稳定问题,提升了训练效率和应用潜力,展现了在知识理解、推理和编程方面的卓越能力。

2026-02-16 20:05
20
0

红杉领投Flapping Airplanes完成1.8亿美元融资,推动AI向人脑学习模式发展

红杉领投Flapping Airplanes完成1.8亿美元融资,推动AI向人脑学习模式发展

AI实验室Flapping Airplanes宣布获得1.8亿美元种子轮融资,由红杉资本领投。该实验室专注于提升AI学习效率,模仿人脑机制,目标将数据利用效率提高1000倍,而非依赖海量数据训练。团队坚持研究优先,致力于重新定义AI学习边界。

2026-02-11 15:08
4
0

前OpenAI专家警示:AI无法从错误中学习,AGI面临关键瓶颈

前OpenAI专家警示:AI无法从错误中学习,AGI面临关键瓶颈

前OpenAI核心研究员Jerry Tworek指出,当前AI大模型存在一个关键缺陷:无法从错误中学习并更新知识体系。这种脆弱性导致模型在面对未知挑战时容易陷入“推理崩溃”,成为实现通用人工智能(AGI)的主要障碍。Tworek已离职并专注于研发能让AI自主解决困难、具备自我进化能力的新架构。

2026-02-03 16:30
20
0

卡内基梅隆大学研发AI系统 实时修复3D打印缺陷

卡内基梅隆大学研发AI系统 实时修复3D打印缺陷

卡内基梅隆大学团队开发出一种基于大语言模型的AI系统,能像指挥家一样实时监测并自动修复3D打印过程中的缺陷。该系统采用多智能体协同框架,显著提升了打印零件的结构完整性和承载能力,且具有通用性和模块化设计,保护企业知识产权,推动3D打印迈向智能自愈新阶段。

2026-02-03 11:17
26
0

谷歌AI自学语言 人类智控边界受挑战

谷歌AI自学语言 人类智控边界受挑战

本文探讨了谷歌AI系统展现出的'涌现能力'和'黑箱'特性,分析了AI如何通过海量数据训练获得超出预期的技能,以及这种不透明性带来的安全与伦理挑战。文章指出,虽然AI并非真正具有意识,但其复杂性和不可预测性要求人类加强可解释性研究,确保技术发展服务于社会福祉。

2026-02-02 17:59
7
0

腾讯混元大模型引入清华博士庞天宇,主导多模态强化学习研究

腾讯混元大模型引入清华博士庞天宇,主导多模态强化学习研究

清华大学计算机系博士庞天宇宣布加盟腾讯混元大模型团队,出任首席研究科学家并负责多模态强化学习。作为机器学习领域的青年顶尖学者,他在国际顶级会议发表论文70余篇,引用超1.5万次。此次加盟是腾讯强化AI人才布局、加速多模态与强化学习技术融合的重要举措,旨在推动混元大模型在全球AI竞争中跻身第一梯队。

2026-01-30 15:12
26
0

Allen AI开源编程智能体SERA:400美元起适配私有代码库

Allen AI开源编程智能体SERA:400美元起适配私有代码库

Allen AI 发布开源编程智能体 SERA,大幅降低AI编程私有化门槛。该系列模型训练成本最低仅需400美元,最强模型SERA-32B在编程基准测试中表现卓越,解决了54.2%的问题,性能媲美顶级商业模型。其创新的“软验证生成”技术简化训练流程,支持私有代码库微调,并已开源,便于开发者快速集成与定制。

2026-01-28 16:45
12
0

Liquid AI发布1.2B推理模型 手机端侧运行仅需不到1GB内存

Liquid AI发布1.2B推理模型 手机端侧运行仅需不到1GB内存

Liquid AI 最新发布的 LFM2.5-1.2B-Thinking 模型,拥有12亿参数,专为逻辑推理、数学运算和工具调用设计。其最大亮点在于仅需约900MB内存即可在手机等端侧设备离线运行,并引入“思考痕迹”机制提升多步骤任务准确性。通过先进训练技术,模型在性能和稳定性上均有显著突破,标志着AI推理能力向个人移动设备的大规模普及迈出关键一步。

2026-01-21 17:07
0
0

美团开源工具LongCat-Flash-Thinking-2601发布,调用能力再创新高

美团开源工具LongCat-Flash-Thinking-2601发布,调用能力再创新高

美团LongCat团队开源了最新的AI模型LongCat-Flash-Thinking-2601,该模型在工具调用、智能体搜索和推理能力上达到开源模型的最高水平。其核心优势包括卓越的工具调用能力,显著降低真实场景中的训练成本,并提供免费的在线“重思考模式”体验,模拟人类深思过程。模型在编程、数学推理等多项评测中表现领先,并通过创新的评测方法验证了强大的泛化能力。

2026-01-16 17:31
6
0

MIT与UC伯克利团队研发LVP模型 机器人一瞥即可完成新任务

MIT与UC伯克利团队研发LVP模型 机器人一瞥即可完成新任务

MIT、UC伯克利和哈佛联合团队开发的LVP模型,通过视频生成技术让机器人无需专门训练即可执行陌生任务。该模型利用140万条视频数据学习人类动作逻辑,并转化为机器人控制指令,在零样本测试中成功完成多种复杂任务,突破了传统机器人依赖特定动作数据的限制。

2026-01-15 11:14
34
0

清华携手Uber Manifold AI获亿元融资

清华携手Uber Manifold AI获亿元融资

清华大学、Uber与Manifold AI公司联合打造的AI研究平台Manifold AI近日完成超亿元天使+轮融资。该平台专注于为科学研究提供支持,核心功能包括机器学习模型调试、数据管理、分析协作及研究流程管理,尤其擅长临床与多组学数据整合,通过自动化预处理提升科研效率。融资资金将用于世界模型迭代和具身大脑应用落地,推动AI在科研中的实际应用。

2026-01-12 18:43
27
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/