TAG:开源评估

Anthropic发布Claude价值观对齐技术,减少政治倾向争议

Anthropic发布Claude价值观对齐技术,减少政治倾向争议

Anthropic公司近日推出新方法,用于评估其聊天机器人Claude在政治问题上的中立性,旨在避免被贴上政治偏见标签。该方法通过系统提示和奖励机制鼓励中立回答,包括尊重传统价值观等内容,以符合美国当前政治需求。测试显示Claude Opus4.1以95%的中立得分紧随Gemini2.5Pro之后。Anthropic已将这一测试方法开源发布在GitHub上,促进AI开发者间的交流与合作。

2025-11-17 11:46
46
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/