TAG:网络安全评测

OpenAI科学家Noam Brown:AI的真正上限可能根本没人测得起

OpenAI科学家Noam Brown:AI的真正上限可能根本没人测得起

OpenAI科学家Noam Brown指出,AI模型能力越来越依赖推理阶段的计算资源(如token数量、费用和时间)。传统基准测试的单一分数已无法准确反映真实表现,尤其在长链推理、网络安全等复杂任务中。他建议转向“性能—推理计算量曲线”评估方式,帮助行业更科学地理解模型上限与成本效益。

2026-06-10 16:16
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/