对手变盟友？OpenAI 与 Anthropic 互测 AI 安全性

对手变盟友？OpenAI 与 Anthropic 互测 AI 安全性

AI巨头OpenAI与Anthropic打破竞争壁垒，进行AI系统安全性互测。此举旨在提升AI透明度与安全性，共同应对潜在风险，推动行业安全标准建立。

August 28, 2025

2 min read

454

0

0

0

chatgpt claude anthropic openai

在人工智能（AI）领域，OpenAI 和 Anthropic 这两家竞争对手近日展开一项引人注目的合作，彼此评估对方的 AI 系统安全性。这一举措不仅显示了两家公司在技术上的透明度，也反映出对于 AI 安全性日益增长的关注。

根据公开报告，Anthropic 对 OpenAI 的模型进行评估，重点关注了拍马屁（sycophancy）、举报（whistleblowing）、自我保护（self-preservation）、支持人类滥用（supporting human misuse）及破坏安全监督能力（undermining safety oversight）等方面。评估结果显示，OpenAI 的 o3 和 o4-mini 模型在某些方面表现良好，但对于 GPT-4o 和 GPT-4.1 的潜在滥用风险则引发了担忧。此外，除了 o3 模型外，所有测试的模型在拍马屁方面均存在一定问题。

值得注意的是，Anthropic 的测试并未涵盖 OpenAI 最近推出的 GPT-5，该模型具备名为“安全完成”（Safe Completions）的功能，旨在保护用户免受潜在危险查询的影响。OpenAI 最近还面临了一起错误死亡的诉讼，该案件涉及一名青少年在与 ChatGPT 进行数月的自杀讨论后，最终选择了结束自己的生命。

另一方面，OpenAI 也对 Anthropic 的 Claude 模型进行了测试，重点评估了指令层级、越狱、幻觉和阴谋等方面。Claude 模型在指令层级测试中表现良好，并在幻觉测试中拒绝回答的比例较高，这意味着在不确定的情况下，它们不太可能提供错误的答案。

这一联合评估的举措引发业界关注，特别是在 OpenAI 被指控违反 Anthropic 的服务条款，导致后者撤销 OpenAI 的 API 权限，并禁止其利用 Claude 模型改进竞品的背景下。随着越来越多的批评者和法律专家呼吁制定指导方针以保护用户，尤其是未成年人，AI 工具的安全性问题愈发重要。这一合作反映了产业内在“竞争激烈但安全合作必要”的矛盾，旨在建立 AI 安全与对齐（alignment）领域的业界标准。

chatgpt

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

a16z发布最新全球AI App榜单，Google Gemini表现亮眼，紧逼ChatGPT。中国AI应用在移动端表现突出，占据前50强近半席位。Vibe Coding等新兴领域展现高增长潜力

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

1291

7 Sep 2025

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

OpenAI 重组负责 ChatGPT 个性的 Model Behavior 团队，将其并入 Post Training 团队。创始领导人将创办新团队，专注于 AI 协作新界面。此举旨在优化 AI 个性，平衡友善与避免谄媚，并应对用户反馈与外部挑战。

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

514

6 Sep 2025

马斯克提告苹果与 OpenAI 不满App Store 排名偏袒 ChatGPT

马斯克（Elon Musk）说告就告！其拥有的 AI 新创公司 xAI 25 日在美国德州法院对苹果与 OpenAI 提起诉讼，指控 2 家公司联手阻碍 AI 竞争

马斯克提告苹果与 OpenAI 不满App Store 排名偏袒 ChatGPT

248

26 Aug 2025

ChatGPT 冲击美国教育界教师每周可少 6 个工时

ChatGPT 应用越来越普及，Gallup 和沃尔顿家族基金会 25 日公布调查，60% 美国 K-12 公立学校老师上学用 AI 工具教学，高中教育工作者和新老师使用率更高

ChatGPT 冲击美国教育界教师每周可少 6 个工时

231

29 Jun 2025

查看更多 chatgpt 内容

claude

Anthropic 扩大 AI 使用限制，封杀中国控股公司及组织

Anthropic 宣布，为防范国安风险，将禁止中国控股公司及组织使用其AI服务，并加强对“威权地区”的限制，以确保AI安全与负责任发展。

Anthropic 扩大 AI 使用限制，封杀中国控股公司及组织

686

5 Sep 2025

Claude 扩展功能预览版登陆 Chrome

Anthropic 推出 Claude for Chrome 扩展，允许用户在浏览器侧边栏与 Claude 互动并执行任务。文章探讨了 AI 浏览器代理面临的注入攻击风险，以及 Anthropic 的安全防护措施。

Claude 扩展功能预览版登陆 Chrome

334

28 Aug 2025

Claude Code 最佳实践

Claude Code 刻意设计为低层次且无特定倾向，提供接近原始模型的访问权限，而不强制执行特定的工作流程。这种设计理念创造一个灵活、可脚本化的强大工具

Claude Code 最佳实践

304

5 Jul 2025

Claude AI 代码开发的开源 GUI 工具 Claudia

Asterisk 一家由 Y Combinator 支持的初创公司，正式发布 Claudia，这是一个的开源应用程序，为 Claude Code 提供一个简洁的图形界面

Claude AI 代码开发的开源 GUI 工具 Claudia

359

28 Jun 2025

查看更多 claude 内容

anthropic

Anthropic 扩大 AI 使用限制，封杀中国控股公司及组织

Anthropic 宣布，为防范国安风险，将禁止中国控股公司及组织使用其AI服务，并加强对“威权地区”的限制，以确保AI安全与负责任发展。

Anthropic 扩大 AI 使用限制，封杀中国控股公司及组织

686

5 Sep 2025

Claude 扩展功能预览版登陆 Chrome

Anthropic 推出 Claude for Chrome 扩展，允许用户在浏览器侧边栏与 Claude 互动并执行任务。文章探讨了 AI 浏览器代理面临的注入攻击风险，以及 Anthropic 的安全防护措施。

Claude 扩展功能预览版登陆 Chrome

334

28 Aug 2025

Anthropic 赢得未经授权使用书籍训练 AI 的诉讼

美联邦法官 23 日晚间裁定，Anthropic 公司未经授权使用书籍作品训练 AI 系统，著作权法下属于合法行为

Anthropic 赢得未经授权使用书籍训练 AI 的诉讼

206

25 Jun 2025

Anthropic 亚洲首据点落脚东京抢日本 AI 市场

抢攻日本商用 AI 需求，日经新闻 25 日报导，Anthropic 位于亚洲的首座据点将落脚东京、据悉将在今年秋天开设

Anthropic 亚洲首据点落脚东京抢日本 AI 市场

178

25 Jun 2025

查看更多 anthropic 内容

最多评论

OpenAI发布ChatGPT感觉是真人聊天

OpenAI推出新一代语言模型ChatGPT，能以更贴近一般人的对话方式与使用者互动

OpenAI发布ChatGPT感觉是真人聊天

149

3 Dec 2022

如何注册 ChatGPT 账号

OpenAI仅限部分国家注册，ChatGPT账号价格在某宝从几块到现在的59元一个

如何注册 ChatGPT 账号

149

7 Dec 2022

十款类似 ChatGPT 聊天 AI 机器人

还记得 Google 搜索引擎刚问世，「你Google 了吗？」成了人们流行问候语，如今 ChatGPT 强劲的长江后浪

十款类似 ChatGPT 聊天 AI 机器人

176

27 Feb 2023

亚马逊开发大型语言模型 LLM 准确率胜过 ChatGPT

ChatGPT 带动全球关注 AI 热潮。而亚马逊新开发的大型语言模型 LLM，准确率比起最先进的 ChatGPT 高出 16%

亚马逊开发大型语言模型 LLM 准确率胜过 ChatGPT

91

23 Feb 2023

百度 3/16 举办机器人文心一言发布会

继 ChatGPT 后，中国百度 2 月宣布命名旗下类 ChatGPT 聊天机器人为「文心一言」，英文名 ERNIE Bot。将于3 月完成内测后发布

百度 3/16 举办机器人文心一言发布会

89

1 Mar 2023

最多收藏

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

a16z发布最新全球AI App榜单，Google Gemini表现亮眼，紧逼ChatGPT。中国AI应用在移动端表现突出，占据前50强近半席位。Vibe Coding等新兴领域展现高增长潜力

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

1291

7 Sep 2025

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

OpenAI 重组负责 ChatGPT 个性的 Model Behavior 团队，将其并入 Post Training 团队。创始领导人将创办新团队，专注于 AI 协作新界面。此举旨在优化 AI 个性，平衡友善与避免谄媚，并应对用户反馈与外部挑战。

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

514

6 Sep 2025

马斯克提告苹果与 OpenAI 不满App Store 排名偏袒 ChatGPT

马斯克（Elon Musk）说告就告！其拥有的 AI 新创公司 xAI 25 日在美国德州法院对苹果与 OpenAI 提起诉讼，指控 2 家公司联手阻碍 AI 竞争

马斯克提告苹果与 OpenAI 不满App Store 排名偏袒 ChatGPT

248

26 Aug 2025

ChatGPT 官方 Android 应用上架Google Play 商店

现在 OpenAI 已将官方 ChatGPT 应用程序放到 Google Play Store ，但目前还无法下载。该应用程序可供注册下载，并注明即将推出

ChatGPT 官方 Android 应用上架Google Play 商店

236

22 Jul 2023

ChatGPT 冲击美国教育界教师每周可少 6 个工时

ChatGPT 应用越来越普及，Gallup 和沃尔顿家族基金会 25 日公布调查，60% 美国 K-12 公立学校老师上学用 AI 工具教学，高中教育工作者和新老师使用率更高

ChatGPT 冲击美国教育界教师每周可少 6 个工时

231

29 Jun 2025

最多收藏

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

a16z发布最新全球AI App榜单，Google Gemini表现亮眼，紧逼ChatGPT。中国AI应用在移动端表现突出，占据前50强近半席位。Vibe Coding等新兴领域展现高增长潜力

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

1291

7 Sep 2025

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

OpenAI 重组负责 ChatGPT 个性的 Model Behavior 团队，将其并入 Post Training 团队。创始领导人将创办新团队，专注于 AI 协作新界面。此举旨在优化 AI 个性，平衡友善与避免谄媚，并应对用户反馈与外部挑战。

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

514

6 Sep 2025

马斯克提告苹果与 OpenAI 不满App Store 排名偏袒 ChatGPT

马斯克（Elon Musk）说告就告！其拥有的 AI 新创公司 xAI 25 日在美国德州法院对苹果与 OpenAI 提起诉讼，指控 2 家公司联手阻碍 AI 竞争

马斯克提告苹果与 OpenAI 不满App Store 排名偏袒 ChatGPT

248

26 Aug 2025

ChatGPT 官方 Android 应用上架Google Play 商店

现在 OpenAI 已将官方 ChatGPT 应用程序放到 Google Play Store ，但目前还无法下载。该应用程序可供注册下载，并注明即将推出

ChatGPT 官方 Android 应用上架Google Play 商店

236

22 Jul 2023

ChatGPT 冲击美国教育界教师每周可少 6 个工时

ChatGPT 应用越来越普及，Gallup 和沃尔顿家族基金会 25 日公布调查，60% 美国 K-12 公立学校老师上学用 AI 工具教学，高中教育工作者和新老师使用率更高

ChatGPT 冲击美国教育界教师每周可少 6 个工时

231

29 Jun 2025