TAG:AI测试
MTSC2026中国互联网测试开发大会将于8月15日落地深圳 聚焦AI时代质效革新
MTSC2026第十五届中国互联网测试开发大会将于2026年8月15日在深圳举办,以“质效革新·智领未来”为主题,聚焦AI时代软件测试与质量保障的革新。大会设置六大技术专场,涵盖AI原生测试、质量治理、Agent驱动执行等前沿领域,汇集国内外科技企业专家分享落地实践,为企业质量团队转型提供参考。作为中国互联网质量保障领域的顶级盛会,大会致力于推动测试技术发展与生态共建。
鸿蒙版抖音通过AI重塑质量保障体系,主功能100%覆盖,效率提升20%
在HDC 2026上,抖音AI效能架构专家雷超杰展示鸿蒙版抖音的AI智能测试方案:主功能点100%覆盖,高频规则场景AI成功率达70%,整体验证效率提升20%,并实现从1000条到5000条用例的规模化落地。AI冲锋+人工守底线,成功重塑质量保障体系,从工具化迈向体系化,让质量跑得更稳。
岩山科技亮相QECon2026,重构AI驱动测试新范式
在QECon2026深圳大会上,岩山科技旗下二三四五网络科技展示了AI驱动软件测试的最新成果。通过知识图谱构建质量知识体系,以及Planner-Skill-Worker跨平台架构,团队解决了AI测试中的知识沉淀和自动化瓶颈,实现了从自动化到认知智能的升级。这些创新实践为软件质量工程提供了可落地的范式,推动行业智能化转型与效能提升。
AI 学霸表现不佳 GPT-4o 专家考试仅获2.7分
《自然》杂志报道的HLE测试显示,GPT-4o在由全球专家设计的2500道高难度题目中仅得2.7分,表现最佳的AI模型也仅得8分。这一结果揭示了AI在深层专业知识和推理能力上的不足,挑战了传统基准测试的高分表象,促使我们重新审视AI的真实智能水平。
AI办公准确率不足25%,进展却超预期
一项由Mercor公司发布的研究报告显示,当前主流AI模型在处理真实办公室任务时准确率不足25%,最高仅为24%。该研究采用APEX-Agents基准测试,模拟律师、顾问等实际工作流,发现AI在跨源信息整合和上下文处理方面存在明显短板,短期内难以替代人类知识工作者。尽管表现有限,但AI准确率从一年前的5%-10%提升至24%,进展速度超出预期。