牛财金

AI升级, 2023年谷歌开发者大会精彩回顾

谷歌开发

2023-05-11

美国东部时间5月10日，2023年谷歌I/O大会举行，在这次谷歌开发者大会上谷歌展现了一系列人工智能AI领域的最新技术成果。

在这次谷歌开发者大会Google I/O 2023上，谷歌亮出了人工智能AI领域开发的最新成果。

1、推出了名为PaLM 2大型语言模型，谷歌已在Gmail和聊天机器人Bard等25种产品中开始运用PaLM 2；

2、将生成式AI引入搜索引擎等产品，新的搜索服务被命名为“搜索生成体验”（SGE），美国用户可在未来几周内通过等候名单体验该服务；

3、推出A3 Virtual Machines，搭配英伟达H100，用于训练和服务最先进的AI模型。

4、宣布面向企业客户的新款人工智能（AI）模型

5、推出Duet AI，应用于Workspace和云服务

6、硬件方面，推出Pixel 7a 手机，售价 499 美元起；推出新款11英寸 Pixel平板电脑，配置G2芯片，售价499美元起；推出自家首款折叠屏手机Google Pixel Fold，起售价为1799美元。

PaLM2的大型语言模型

和此前媒体曝光的消息一致，本次谷歌正式发布新的通用大语言模型PaLM 2。PaLM 2是驱动AI机器人Bard的模型的升级版，可以生成多种文本回应用户。谷歌称，它可以使用100种语言，擅长数学、软件开发、语言翻译推理和自然语言生成。

谷歌AI研究实验室DeepMind的副总裁Zoubin Ghahramani称PaLM2“比我们以前最先进的语言模型还好”，PaLM 2使用谷歌定制的AI芯片，比初版PaLM的运行效率更高。PaLM 2能使用Fortran等20多种编程语言，它还可以用100多种口头语言。

Ghahramani透露，现在约有20种谷歌的产品使用PaLM 2，轻量级的PaLM 2版本可以在移动设备上运行。

谷歌宣布，升级AI聊天机器人Bard，让它改由PaLM 2驱动，可以提供更高明的回复，从本周三起，让约180个国家地区的用户都可以开放申请使用Bard。

谷歌称，Bard的编程能力已经有所改善，Bard现在接入多种编程工具。Bard学习了C++、Go、Python等20多种编程语言，以及和谷歌表格（Google Sheets）的函数。

PaLM 2在医学等专业领域具有一些优势。它可以回答专家级别的体检问题。

AI 生成图像的真实性在未来可能会成为一个关注点。通过添加图像元数据，可以更轻松地识别合成图像。谷歌有另一个AI 模型 Gemini，它可以识别“合成生成的内容”，即由 AI 创建的文本、图像和镜头。Gemini 和其他AI模型将检查水印、即内容中集成的元数据，以及其他技术，告诉用户哪些是原始未变的，哪些是AI创造的。

谷歌聊天机器人Bard

谷歌产品主管、Bard的负责人Jack Krawczyk称，Bard将能够用英语、日语和韩语回复，谷歌将很快让Bard适用的语言达到40种。

Bard将很快在回复中包含图片，在接下来的几个月里，谷歌将使通过 Google Lens 工具，让Bard更容易回应用户的图片提示。比如，用户可以用智能手机指着满抽屉的艺术品和手工艺品工具和配件，问Bard它们可以用来做什么。

Krawczyk 说，未来Bard能将谷歌地图、文档、表格和 Gmail的信息带入对话中。Bard 还将能在 Adobe等第三方工具的帮助下回复用户。他提到Adobe的生成式 AI服务Firefly，说它可以根据文字描述创建图像。

Gmail、谷歌地图和相册的AI功能

同时，谷歌发布，旗下产品广泛应用AI技术的功能，从文档等各种协作工具、到电邮、搜索、云等各种服务一网打尽，让新型大模型支持的AI功能在各种产品中全面结合。

Gmail将利用生成式AI推出实现“帮我写”（Help Me Write）的功能，帮助用户写邮件。

例如，通过写一封信，获得航空公司的全额退款。谷歌有些设置能让生成的文本更长或更短，并且可以用之前的消息作为上下文，帮助AI编写内容。只要输入你想要的提示词，点击创建，就会出现一个完整的草稿。

谷歌地图将提供名为“沉浸式视图”（Immersive View）的AI工具。该工具将获取空气质量和天气的信息，为谷歌地图用户选出一条路线，并将路线可视化。沉浸式视图将在未来几个月内推广到十几个大城市。

谷歌CEO Pichai展示了一条位于曼哈顿的自行车骑行路线。用户可以看到，走这条路线，沿着西区高速公路骑车会有什么情景，其中有AI支持的交通、天气和路线本身的渲染图。从演示中可以看到具备了flyover功能，可以帮助将出行信息叠加到用户界面。

谷歌相册将推出名为“神奇编辑”（Magic Editor）的功能，用生成式AI 帮助用户重新构建照片，可以选择编辑照片的任何一部分，无论是画面的主角、天空还是背景，都可以编辑，可以抓取可以移除。

比如用户主要想拍的是瀑布，可以把瀑布边的人挪开些，拍照时人忘了取下背带，可以把拍到的背带抹去，可以把拍出的天空调得更明亮。

Workspace的Duet AI AI搜索功能Converse

谷歌称，谷歌的协作与生产力工具Workspace将很快能让用户借助AI生成完整的文档，并填写电子表格。这种AI服务名为Duet AI，将在今年晚些时候面向订阅者推出。

Duet AI可以让用户在文档、表格和幻灯片中融入AI服务。比如用户可以要求AI帮助撰写简历、整理企业图表或者为幻灯片生成图像，可以帮用户写文章和销售宣传材料，将它们放在谷歌文档中给所有人共享。谷歌幻灯片可以在App内生成AI图像。

谷歌为搜索服务推出了名为Converse的生成式AI功能。过去，用户想知道一个问题的回答，会在谷歌得到多个搜索结果，得自己综合这些结果。Converse可以为用户合成式的搜索结果。具体来说，它能提供一种“快照”，其中包括一些搜索结果文本或图片的生成式AI内容块，在它的下方是相关的链接。

谷歌称，Converse的搜索结果里会融入广告。和Workspace的一些AI功能一样，Converse 将提供一种“对话模式”，用户可以在其中“提出”后续问题。

谷歌云推出Duet AI服务和A3超级计算机虚拟机

谷歌云的CEO Thomas Kurian称，所有谷歌的云服务合作伙伴都可以付费使用谷歌的AI模型，以及算力。

今年夏季，连锁汉堡餐厅Wendy’s将运用谷歌的技术，在俄亥俄州的一家门店接受用户订单，避免用户排长队。谷歌强调，经过其调整的大语言模型可以理解Wendy’s的产品名，比如简称JBC的产品是一种培根芝士汉堡。

谷歌推出了一个名为Tailwind的项目。它可以记录开发者的笔记，并可以在云端网盘中整理不同的笔记。它还能建一个学习指南，提取笔记中的关键概念。用户您可以要求Tailwind 整理信息，或根据所做的笔记向它提问。它也显示引用内容。

谷歌云还宣布，推出A3超级计算机虚拟机，旨在为语言模型提供优异的训练性能。这些虚拟机将搭载英伟达H100 GPU、第四代英特尔Xeon可扩展处理器，与谷歌专门的数据中心结合，可提供高达26 exaFlops 的算力，将有助于减少训练更大模型的时间和成本。

谷歌新手机Pixel 7a、首款可折叠手机Pixel Fold 平板电脑Pixel

谷歌还发布了两款手机，其中包括首次推出的可折叠手机Pixel Fold，同时开始预售新款平板电脑Pixel。谷歌确认，新版智能手表Wear OS 4将在今年晚些时候面世，同时会有一批Wear OS配套App和功能出炉。谷歌新一代安卓手机Pixel 7a，售价499美元，搭载谷歌自研的Tensor G2芯片，运行内存8GB，比Pixel 7和Pixel 7 Pro更平价。