TAG:PlanningBench

腾讯与人大高瓴联合开发开源规划评测框架 PlanningBench

腾讯与人大高瓴联合开发开源规划评测框架 PlanningBench

腾讯混元团队与人大高瓴人工智能学院联合推出开源规划评测框架 PlanningBench,旨在系统化评测和训练大语言模型的规划能力。该框架抽象出30多种规划任务类型(如日程排布、资源分配、人力排班等),通过可验证数据生成与Checklist评估,精确诊断复杂约束下的真实规划能力。训练后模型在未见任务上表现显著提升,为AI规划研究提供真实场景闭环工具。

2026-06-10 18:25
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/