Google Med-PaLM 2 AI 美国USMLE 医师资格考试

根据 12 日的一项同行评审研究，Google 的 AI 医疗聊天机器人在难度极高的美国USMLE 执业医师资格考试中及格，但其答案仍远比不上人类医师

July 14, 2023

3 min read

575

palm2 ai google

根据 12 日的一项同行评审研究，Google 的 AI 医疗聊天机器人在难度极高的美国USMLE 执业医师资格考试中及格，但其答案仍远比不上人类医师。

法新社报导，去年，ChatGPT 由 Google 竞争对手 Microsoft（微软）资助的OpenAI 开发上市，科技巨头开始在快速发展的人工智能领域竞争拉开序幕。

尽管对于人工智能未来的可能性和危险性已经引起广泛讨论，但在健康领域，这项技术已经得到具体进展，包括能够像人类一样解读某些医学扫描图像。

去年 12 月，Google 首次在学术著作预印本中，展示回答医学问题的 AI 工具 Med-PaLM。与 ChatGPT 不同，Google 尚未公布于众。

这家美国科技巨头说，Med-PaLM 是第一个通过美国医师执照资格考试的大语言模型，该模型的 AI 技术通过大量人类生成的文本训练。

这项考试的受试者为美国医学生和受训医师，及格分数约为 60 分。在 2 月，一项研究指出 ChatGPT 已经达到及格或接近及格的结果。

在 12 日发表于自然杂志（journal Nature）的同行评审研究中，Google 研究人员表示，Med-PaLM 在具有美国 USMLE 执业医师资格考试选择题中取得 67.6 分。该研究写道：Med-PaLM的表现令人鼓舞，但仍比临床医师差。

为了辨识并减少错觉，Google 已经开发一套新的评估指标。Google 研究人员及这份新研究报告的主要作者辛格霍（Karan Singhal）告诉法新社，团队已使用这一套评估指标测试他们新版本的模型，并取得非常令人兴奋的结果。

一份发布于 5 月的学术著作预印本中的研究指出，Med-PaLM 2 在美国 USMLE 执业医师资格考试中取得 86.5 分，比前一个版本提高近 20%。

未参与研究的英国巴斯大学（University of Bath）电脑科学家达芬波特（James Davenport）说，这些 AI 医疗聊天机器人正面临一个棘手问题，但人们故意视而不见。他表示，医学问题与实际医学间存有很大的差异，医学实际包含诊断和治疗真正的健康问题。

英国里兹大学（Leeds University）AI 专家寇恩（Anthony Cohn）说：「错觉大概会永远是这些大语言模型的问题，因为他们具有统计学上的本质。」因此，寇恩指出：「这些模型应该始终被视为辅具，而非最终的决策者。」

palm2

申请 Google Search Labs PaLM2 教程

Google Search Labs 是一项新计划，允许用户在 Google 搜索中体验 PaLM2 生成式 AI 带来的全新的搜索能力

703

12 Jun 2023

Google 收复因 ChatGPT 的失土

Google 把全新 AI 模型应用到广告，并协助 YouTube 创作者。Google 使用 PaLM 2 测试 YouTube 儿童内容，为儿童内容划分等级

444

19 May 2023

Google Bard AI 聊天机器人全面开放

Google I/O 2023 开发者大会，Google 全面开放体验聊天机器人 Bard AI，并强化多项功能，支持根据图片生成文字描述或者根据文字生成图片

531

11 May 2023

Google 发布 PaLM 2 模型对抗 GPT-4

Google 发布 PaLM 2 模型使用 100 种语言数据训练，涵盖数学算式的科学研究论文、网页。逻辑推理以及数学方面有显著提升并精通 JavaScript 编程语言

439

11 May 2023

查看更多 palm2 内容

ai

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

2912

7 Sep 2025

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

OpenAI 重组负责 ChatGPT 个性的 Model Behavior 团队，将其并入 Post Training 团队。创始领导人将创办新团队，专注于 AI 协作新界面。此举旨在优化 AI 个性，平衡友善与避免谄媚，并应对用户反馈与外部挑战。

2106

6 Sep 2025

Anthropic 扩大 AI 使用限制，封杀中国控股公司及组织

Anthropic 宣布，为防范国安风险，将禁止中国控股公司及组织使用其AI服务，并加强对“威权地区”的限制，以确保AI安全与负责任发展。

1950

5 Sep 2025

苹果AI策略：巨头“付费上场”，坐收渔翁之利

苹果AI策略以“付费上场”为核心，利用其庞大用户基础，吸引AI巨头付费成为iPhone默认选项，坐收高额分润，而非自行投入巨资研发AI技术。

2208

5 Sep 2025

查看更多 ai 内容

google

亚马逊想做 AI，内部文件揭为何难敌 OpenAI 与 Google

亚马逊在AI人才争夺战中面临困境，内部文件显示薪酬结构、公司声誉滞后及强制回办公室政策是主要原因，使其难以吸引顶尖AI人才

1280

31 Aug 2025

Google 用 YouTube 视频训练 AI 引创作者不满

Google 使用 YouTube 视频训练 AI 工具，引发创作者不满，担心内容被滥用及 AI 视频竞争。创作者未获补偿，且肖像可能被深度伪造。

790

29 Aug 2025

Google 翻译升级：AI 实时对话 & 定制学习

Google 翻译引入 Gemini AI，新增实时对话翻译（支持70+语言）和定制化语言学习功能，提升沟通效率与学习体验。

1574

28 Aug 2025

苹果AI外包Google Gemini？品牌市占可能双输

苹果可能外包AI给Google Gemini驱动Siri，专家担忧此举将损害苹果品牌形象与市占，面临双输局面。

1313

28 Aug 2025

查看更多 google 内容

最多评论

Google 发布 PaLM 2 模型对抗 GPT-4

Google 发布 PaLM 2 模型使用 100 种语言数据训练，涵盖数学算式的科学研究论文、网页。逻辑推理以及数学方面有显著提升并精通 JavaScript 编程语言

439

11 May 2023

Google Bard AI 聊天机器人全面开放

Google I/O 2023 开发者大会，Google 全面开放体验聊天机器人 Bard AI，并强化多项功能，支持根据图片生成文字描述或者根据文字生成图片

531

11 May 2023

Google 收复因 ChatGPT 的失土

Google 把全新 AI 模型应用到广告，并协助 YouTube 创作者。Google 使用 PaLM 2 测试 YouTube 儿童内容，为儿童内容划分等级

444

19 May 2023

申请 Google Search Labs PaLM2 教程

Google Search Labs 是一项新计划，允许用户在 Google 搜索中体验 PaLM2 生成式 AI 带来的全新的搜索能力

703

12 Jun 2023

最多收藏

申请 Google Search Labs PaLM2 教程

Google Search Labs 是一项新计划，允许用户在 Google 搜索中体验 PaLM2 生成式 AI 带来的全新的搜索能力

703

12 Jun 2023

Google Bard AI 聊天机器人全面开放

Google I/O 2023 开发者大会，Google 全面开放体验聊天机器人 Bard AI，并强化多项功能，支持根据图片生成文字描述或者根据文字生成图片

531

11 May 2023

Google 收复因 ChatGPT 的失土

Google 把全新 AI 模型应用到广告，并协助 YouTube 创作者。Google 使用 PaLM 2 测试 YouTube 儿童内容，为儿童内容划分等级

444

19 May 2023

Google 发布 PaLM 2 模型对抗 GPT-4

Google 发布 PaLM 2 模型使用 100 种语言数据训练，涵盖数学算式的科学研究论文、网页。逻辑推理以及数学方面有显著提升并精通 JavaScript 编程语言

439

11 May 2023

最多收藏

申请 Google Search Labs PaLM2 教程

Google Search Labs 是一项新计划，允许用户在 Google 搜索中体验 PaLM2 生成式 AI 带来的全新的搜索能力

703

12 Jun 2023

Google Bard AI 聊天机器人全面开放

Google I/O 2023 开发者大会，Google 全面开放体验聊天机器人 Bard AI，并强化多项功能，支持根据图片生成文字描述或者根据文字生成图片

531

11 May 2023

Google 收复因 ChatGPT 的失土

Google 把全新 AI 模型应用到广告，并协助 YouTube 创作者。Google 使用 PaLM 2 测试 YouTube 儿童内容，为儿童内容划分等级

444

19 May 2023

Google 发布 PaLM 2 模型对抗 GPT-4

Google 发布 PaLM 2 模型使用 100 种语言数据训练，涵盖数学算式的科学研究论文、网页。逻辑推理以及数学方面有显著提升并精通 JavaScript 编程语言

439

11 May 2023