Meta 发布可以识别图像中物体的 AI 模型

Meta 发布名为 Segment Anything Model（SAM）的 AI 模型，可以辨识图像和影片中的单一物体，即便是过去 AI 训练没有遇过的物体也能辨识出来

April 07, 2023

3 min read

441

ai meta SAM

微软投资的 OpenAI 推出 ChatGPT 后引起轰动，掀起一波 AI 竞赛，大型科技公司纷纷宣扬他们在 AI 技术的突破，其中 Meta 展示他们在影像分析和计算机视觉方面的最新进展。

Meta 发布名为 Segment Anything Model（SAM）的 AI 模型，可以辨识图像和影片中的单一物体，即便是过去 AI 训练没有遇过的物体也能辨识出来。

根据 Meta 官方论坛文章指出，SAM 是一种影像分割模型，可以根据文字提示或使用者点击进而圈出图像中的特定物体。

影像分割是计算机视觉（Computer Vision，CV）的一种过程，涉及将图像区分成多个片段或区域，再对应特定的物体。

这是为了让图像易于分析或处理。Meta 认为影像分割技术有助于理解网页内容、开发 AR 应用、编辑图像，也能将影片中的动物或物体自动定位、追踪，以进行学术研究。

通常建立准确的影像分析模型需要专家进行高度专业化的工作，现在通过 SAM，Meta 希望能减少影像分割对专业训练和知识的要求，促成计算机视觉的进一步发展。

除了 SAM 以外，Meta 还建立一个名为 SA-1B（Segment Anything 1-Billion mask dataset）的训练数据集，其中包括从一家大型照片公司获得许可的 1,100 万张图像，以及利用影像分割模型产生的11 亿个分割遮罩。

目前 SAM 的源码已在 GitHub 开源，还有展示网站能够免费体验，Meta 将让 SAM 和 SA-1B 能在 Apache 2.0 授权条款下用于研究。

《路透社》报导指出，Meta 董事长 Mark Zuckerberg 强调今年将生成式AI（Generative AI）纳入公司旗下服务的重要性。

尽管尚未发表使用生成式 AI 的商用产品，但 Meta 已在 Facebook 平台使用类似SAM 的技术进行照片标记、内容审核，以及确认 Facebook 和 Instagram 的推荐贴文。

虽然影像分割技术并不新奇，但 SAM 能够辨识出不存在于训练资料集内的物体，并对学术研究开放使用，成为这项技术最大亮点，SA-1B 的发布可望也能推动新一代计算机视觉应用。

ai

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

2885

7 Sep 2025

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

OpenAI 重组负责 ChatGPT 个性的 Model Behavior 团队，将其并入 Post Training 团队。创始领导人将创办新团队，专注于 AI 协作新界面。此举旨在优化 AI 个性，平衡友善与避免谄媚，并应对用户反馈与外部挑战。

2089

6 Sep 2025

Anthropic 扩大 AI 使用限制，封杀中国控股公司及组织

Anthropic 宣布，为防范国安风险，将禁止中国控股公司及组织使用其AI服务，并加强对“威权地区”的限制，以确保AI安全与负责任发展。

1928

5 Sep 2025

苹果AI策略：巨头“付费上场”，坐收渔翁之利

苹果AI策略以“付费上场”为核心，利用其庞大用户基础，吸引AI巨头付费成为iPhone默认选项，坐收高额分润，而非自行投入巨资研发AI技术。

2191

5 Sep 2025

查看更多 ai 内容

Meta 赢 AI 版权诉讼但警告非全然合法

有关 Meta 使用数百万本书籍训练模型一案，25 日由法官裁定属于「合理使用」，这项判决对利用版权材料开发 AI 的科技公司而言可能又是一次胜利

365

27 Jun 2025

Meta 祭银弹攻势从OpenAI 挖角三名人才

Meta 大力网罗 AI 人才，据传已从 OpenAI 挖角三位人员；Meta 计划于今年投入高达 650 亿美元的资本支出，致力发展 AI

471

27 Jun 2025

Meta 砸重金收购 Scale AI 数据才是真正的黄金

AI 比赛从更强大的算法或更快的芯片，正走向下一阶段。一家快速崛起的公司 Scale AI 告诉我关键胜负其实藏在另一个不起眼的环节，就是谁能掌握最优质的数据原料

499

23 Jun 2025

Meta 准备训练超越 GPT-4 的模型

华尔街日报报导指出，Meta 持续采购 AI 芯片并建立数据中心，开发一个能与ChatGPT 一样强大的聊天机器人

448

11 Sep 2023

查看更多 meta 内容

SAM

暂无相关文章

最多评论

Google translatotron可以让你说另一种语言

谷歌翻译是该公司最常用的产品之一。它可以帮助人们从输入文本，拍摄图片和使用语音到文本技术将一种语言翻译成另一种语言。现在，Google推出了一个名为Translatotron的新项目，该项目将提供语音到语音的直接转换。

518

17 May 2019

三星的Deepfake AI让蒙娜丽莎焕发生机

据BBC报道，三星在莫斯科的AI研究实验室发布deepfake技术最新版，这种技术能从将其它的人的面部特征映射到照片上

433

25 May 2019

OpenAI 董事长的人生传记

ChatGPT 毫无疑问会站在众神之巅，至于 ChatGPT 的催生者OpenAI 和 OpenAI 董事长的穆拉提（Mira Murati）同样受科技迷膜拜

445

3 Apr 2023

Numbers Station AI 根据描述自动生成 SQL语句

Numbers Station 把近来火热的 AI 运用于数据处理，使用者只要输入一句话，即可自动产生 SQL 语句

522

8 Apr 2023

好莱坞 1.5 万名编剧罢工 AI 威胁贬低工作价值

许多职业如会计、客户服务。已看到公司使用 AI 来自动化部分工作，甚至取代他们的职务。首先提出抗议的是好莱坞 1.5 万名编剧罢工

526

16 May 2023

最多收藏

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

2885

7 Sep 2025

苹果AI策略：巨头“付费上场”，坐收渔翁之利

苹果AI策略以“付费上场”为核心，利用其庞大用户基础，吸引AI巨头付费成为iPhone默认选项，坐收高额分润，而非自行投入巨资研发AI技术。

2191

5 Sep 2025

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

2089

6 Sep 2025

Anthropic 扩大 AI 使用限制，封杀中国控股公司及组织

Anthropic 宣布，为防范国安风险，将禁止中国控股公司及组织使用其AI服务，并加强对“威权地区”的限制，以确保AI安全与负责任发展。

1928

5 Sep 2025

AI 绘画也违法？华纳兄弟探索控告 Midjourney 盗用超人、蝙蝠侠形象

华纳兄弟控告AI绘画工具Midjourney盗用超人、蝙蝠侠等经典角色版权，引发生成式AI与知识产权保护的热烈讨论，可能重塑数字创作法律界限

1707

5 Sep 2025

最多收藏

a16z AI App 排行：Gemini 挑战ChatGPT，中国力量崛起

2885

7 Sep 2025

苹果AI策略：巨头“付费上场”，坐收渔翁之利

苹果AI策略以“付费上场”为核心，利用其庞大用户基础，吸引AI巨头付费成为iPhone默认选项，坐收高额分润，而非自行投入巨资研发AI技术。

2191

5 Sep 2025

OpenAI 重组 ChatGPT 个性团队：AI 互动新篇章

2089

6 Sep 2025

Anthropic 扩大 AI 使用限制，封杀中国控股公司及组织

Anthropic 宣布，为防范国安风险，将禁止中国控股公司及组织使用其AI服务，并加强对“威权地区”的限制，以确保AI安全与负责任发展。

1928

5 Sep 2025

AI 绘画也违法？华纳兄弟探索控告 Midjourney 盗用超人、蝙蝠侠形象

华纳兄弟控告AI绘画工具Midjourney盗用超人、蝙蝠侠等经典角色版权，引发生成式AI与知识产权保护的热烈讨论，可能重塑数字创作法律界限

1707

5 Sep 2025