TAG:AI评估

全球第四家，OpenAI与韩国人工智能安全研究所达成深度合作

全球第四家，OpenAI与韩国人工智能安全研究所达成深度合作

OpenAI与韩国人工智能安全研究所正式签署合作备忘录，这是继美国、英国、日本之后OpenAI的第四次国家级AI安全合作。双方将重点围绕网络安全等高风险领域，开展高级AI系统的安全评估、基准测试，并定制韩语及韩国本地化评估标准。该合作标志着国际AI安全治理迈出坚实一步，有助于降低技术风险并构建全球信任。

2026-06-29 10:30

0

·

0

AI科研新基准：FrontierScience测评模型推理能力

AI科研新基准：FrontierScience测评模型推理能力

本文介绍了新推出的AI科学研究基准FrontierScience，该基准专注于评估AI模型在物理、化学和生物等领域的专家级科学推理能力。文章通过初步评估结果展示了GPT-5.2在奥林匹克版和研究版中的表现，并探讨了AI如何加速科学研究流程以及当前在开放式思维方面的局限性。

2025-12-17 16:40

4

·

0

谷歌FACTS基准揭示AI模型准确率上限70%

谷歌FACTS基准揭示AI模型准确率上限70%

谷歌与Kaggle联合发布FACTS基准套件，填补AI模型事实准确性评估的标准化空白。该基准涵盖法律、金融和医疗等关键领域，测试显示包括Gemini3Pro、GPT-5在内的主流模型整体准确率均未突破70%，尤其在多模态任务中表现不足，为企业AI应用提供重要参考。

2025-12-11 14:29

40

·

0

快讯

美股三大指数震荡整理，芯片股走高，光通信板块大涨

2026-05-11

·

0 浏览

多空胶着恒指震荡整理，AI景气外溢主导行情波动

2026-05-11

·

0 浏览

宠物AI公司PurrPurr获阿尔法公社投资首年GMV目标5000万

2026-05-11

·

0 浏览

隆源股份业绩说明会回应今年新能源汽车零部件领域新客户洽谈中

2026-05-11

·

0 浏览

中国品牌市占率达75%，4月我国汽车销量约252.6万辆，新能源汽车出口贡献度近五成

2026-05-11

·

0 浏览

英特尔涨超8%，CEO陈立武透露与英伟达合作开发新品；与台积电成立芯片企业，索尼涨近7%；抗病毒概念股普涨，Moderna涨7.9%

2026-05-11

·

0 浏览

4月汽车出口增长51% 国内零售下跌超20%

2026-05-11

·

0 浏览

4月全国新能源汽车渗透率历史首次突破60%，燃油车零售同比暴跌37%

2026-05-11

·

0 浏览

港股复盘：强势翻红芯片概念股冲高回落短期风险需警惕

2026-05-11

·

0 浏览

申昊科技拟设具身智能子公司加码人形机器人业务

2026-05-11

·

0 浏览

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读

机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台

关注爱力方，掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/

浙ICP备2025176963号-3

标签云 RSS订阅滚动资讯资讯排行