myfreax

Google 万物皆有生成式 AI

在过去的几周里,Google 发布一系列围绕其生成式 AI 产品组合的公告。尽管有些人认为有点落后微软和 ChatGPT 生成式 AI,但很明显谷歌拥有自己全面的企业级战略方法

8 min read
By myfreax
Google 万物皆有生成式 AI
Google 万物皆有生成式 AI

在过去的几周里,Google 发布一系列围绕其生成式 AI 产品组合的公告。尽管有些人认为有点落后微软和 ChatGPT 生成式 AI,但很明显谷歌拥有自己全面的企业级战略方法。

在最近结束的 Google I/O 2023 大会上,这家搜索巨头公布其生成式 AI 战略。从BardProject Tailwind,生成式 AI 主导了这次会议。

谷歌对人工智能相关研究的长期投资创造强大的模型基础,这些模型已成为新产品和服务的核心。本文仔细研究谷歌的生成式人工智能战略。

基础模型 – 秘密武器

基于自我监督学习技术,基础模型是在大型公开数据上进行训练的。这些基础模型可以适应各种用例和场景,而无需重新训练。

四个基础模型为 Google 的生成式 AI 栈提供支持:

PaLM 2:这是一个大语言模型 (LLM),经过 100 多种语言的训练,可以执行文本处理、情感分析、分类等。据谷歌称,该模型可以理解、生成和翻译各种语言的微妙文本,包括习语、诗歌和谜语。它可以展示逻辑和推理,甚至可以解决复杂的数学方程。

Codey:一个基础模型,可以嵌入标准开发套件 SDK 或应用程序中,用于提高开发人员的工作效率。它通过代码生成和代码完成来提高开发者的效率。Codey 基于外部来源的高质量且许可的代码进行优化和微调并增强其性能。

谷歌云首席执行官托马斯·库里安 (Thomas Kurian) 公告 Codey

Imagen:这种文本到图像的基础模型允许生成和定制工作室级别的图像。开发者可以使用此模型来创建或编辑图像。

通过 Imagen 生成的图像

Chirp:经过训练以执行语音到文本转换的基础模型。它可以与多种语言一起使用来生成字幕并构建语音辅助功能。

ChatGPT 竞争对手 Google Bard

Google Bard 是一个基于 PaLM 2 LLM 的聊天机器人。当前版本的 Bard 有英语、日语和韩语版本,可以通过 Google Bard 网站或通过 Google Assistant 访问。

Bard 是由 PaLM 2 提供支持的 Google 聊天机器人。未来,Bard 的回答将包括图像和文本,使交互对用户来说更有用、更丰富。还可以使用图像作为输入,让 Bard 编写标题或执行图像搜索。

Bard 还可以响应与代码相关的查询。它允许开发者将响应导出到 Google Colab 或 Replit 代码环境。除了代码生成和解释之外,Bard 还将包含带有原始来源链接的引用。

Duet AI 面向开发者和消费者的 AI

基础模型经过微调,可以帮助开发人员和消费者完成日常任务。Duet AI 是谷歌用来识别注入各种产品的生成式 AI 体验的品牌。

DevOps 的 Duet AI

当谈到开发者和运维时,谷歌宣布基于 Duet AI 的服务,这些服务嵌入到开发环境及其云服务中。

代码帮助:Google 将为 VS Code 和 JetBrains 等流行 IDE 提供插件。帮助于开发者根据注释和其他形式的指令自动生成代码。此功能与 GitHub Copliot 和 Amazon Code Whisperer 以及 Tabnine 竞争。

云工作站云工作站是云中预先配置的开发环境,附带企业级的运行时、框架和 IDE。Duet AI 使云工作站能够生成代码/样板、代码完成和代码解释。它甚至可以扫描源码的安全漏洞并提出适当的修复建议。

Cloud Console:谷歌将在 Google Cloud Console 用户界面中嵌入一个聊天窗口,运维人员可以通过该窗口与聊天机器人进行交互。与 Bard 和 ChatGPT 一样,该聊天机器人可以帮助运维人员执行特定任务或与管理云相关的功能所需的步骤。

Cloud Shell:与 Cloud Console 的聊天机器人一样,Cloud Shell 是嵌入在浏览器中的终端窗口,将有一个聊天机器人。它可以生成命令和脚本来自动执行各种 DevOps 和 CloudOps 相关任务。

面向最终用户的 Duet AI

谷歌将人工智能的力量扩展到其消费产品(例如 Google Workspace)是理所当然的事情。很快,文档、表格、幻灯片和 Meet 将获得一个聊天机器人来帮助用户生成、转录和总结内容。基础模型与 Google Workspace 之间的集成使最终用户变得富有创造力和生产力。

谷歌还展示 Project Tailwind,这是一款 AI 优先的笔记本,数据存储在 Google Drive、Workspace。目前,这项实验性服务仅在美国提供。

低代码和无代码的 Duet AI

AppSheet 是 Google 的低代码 / 无代码平台,将与 Duet AI 集成。借助此功能,用户可以创建智能业务应用程序、连接数据并通过 PaLM 2 支持的自然语言将工作流程构建到 Google Workspace 。

谷歌还发布 MakerSuite,这是一款可以让开发人员快速轻松地开始原型设计的工具。他们将能够迭代提示、使用合成数据增强数据集,并轻松调整自定义模型。当他们准备好转向代码时,MakerSuite 会让他们将提示作为代码导出到语言和框架,例如 Python 和 Node.js。

搜索生成体验 SGE

通过生成式 AI 的注入,谷歌搜索将从根本上改变。通过分析查询的语义,搜索将变得上下文相关且高效。

谷歌正在将  Shopping Graph 与生成式 AI 相结合,为用户提供身临其境的体验,生成式 AI 拥有超过 350 亿个产品列表。传统搜索和生成人工智能的结合将改变用户体验网络的方式。

Vertex AI 和 PaLM 2 API

Google 将通过专用 API 公开 PaLM 2 LLM。目前尚不可用,但当它准备就绪时,前端和移动开发人员可以轻松使用 PaLM 2 API 来构建基于 AI 应用程序。

Vertex AI 是 Google 的云端 ML PaaS,已为生成式 AI 做好准备。它有一个更新的模型,它是 PaLM 2、Imagen 和 Chirp 等基础模型的仓库。谷歌还将第三方基础模型引入其云平台。

Vertex AI – 模型花园

Vertex AI 的 Generative AI Studio 充当通过调整各种参数和提示来探索 API 的游乐场。开发者可以在调用 API 或使用 SDK 使用 Generative AI Studio。

最后,Gen App Builder 是一项新服务,可以让不熟悉 ML 或 AI 的传统开发者构建生成式 AI 应用程序。开发者可以使用文本和图像的组合来创建可以搜索文档、照片和视频内容的信息的应用程序。这项服务使他们能够建立有吸引力的客户互动。

当我们分析 Google 的生成式 AI 战略时,我们会发现 PaLM 2 是其宣布的几乎所有服务的基础。

PaLM 2 正在帮助谷歌与 OpenAI 和微软竞争。它正在做 OpenAI 和微软所做的事情。