TAG:One-Eval
DeepSeek-V4爆火背后:北大开源框架One-Eval如何终结AI测评“噩梦”
本文聚焦DeepSeek-V4发布后北大DCAI团队10小时完成自动化评测的案例,解析开源框架One-Eval如何以自然语言智能体、全链路可追溯与人工在环机制,破解大模型评测中的高门槛、黑盒与数据污染难题,并揭示评测产业“诊断+数据补全”的商业闭环及开源带来的行业变量。
前推特CEO创办的AI初创公司获融资,估值达20亿美元
2026-04-29
0 浏览
北京车展不止看车:智能化与汽车产业新趋势同台亮相
2026-04-29
0 浏览
AI需求推高内存消耗,三大巨头扩产仍追不上需求
2026-04-29
0 浏览
AI算力爆发带动电力需求增长,海信史文伯称AI数据中心耗电激增,高压与液冷技术重构电力新格局
2026-04-29
0 浏览
格力电器称已具备做人形机器人的能力,绿色动力与阿里云达成AI全栈合作丨数智早参
2026-04-29
0 浏览
杭州35岁男子收到“岗位被AI取代”通知后被辞退,法院判决公司违法并支付2N赔偿金
2026-04-29
0 浏览
欧莱雅年度沟通会释放行业信号:高端美妆品牌力回归,下沉市场增长超越一二线,AI重塑美妆行业
2026-04-29
0 浏览
这家公司推出机器人“本体”新形态,探索具身智能发展方向
2026-04-29
0 浏览
AWS迅速接入OpenAI全系产品,被指转向与亚马逊合作
2026-04-29
0 浏览
网易有道全面转向AI:在线营销首次成为营收支柱,多款AI新品亮相
2026-04-29
0 浏览