AI升级, 2023年谷歌开发者大会精彩回顾

谷歌开发
2023-05-11

美国东部时间5月10日,2023年谷歌I/O大会举行,在这次谷歌开发者大会上谷歌展现了一系列人工智能AI领域的最新技术成果。


在这次谷歌开发者大会Google I/O 2023上,谷歌亮出了人工智能AI领域开发的最新成果。


1、推出了名为PaLM 2大型语言模型,谷歌已在Gmail和聊天机器人Bard等25种产品中开始运用PaLM 2;

2、将生成式AI引入搜索引擎等产品,新的搜索服务被命名为“搜索生成体验”(SGE),美国用户可在未来几周内通过等候名单体验该服务;

3、推出A3 Virtual Machines,搭配英伟达H100,用于训练和服务最先进的AI模型。

4、宣布面向企业客户的新款人工智能(AI)模型

5、推出Duet AI,应用于Workspace和云服务

6、硬件方面,推出Pixel 7a 手机,售价 499 美元起;推出新款11英寸 Pixel平板电脑,配置G2芯片,售价499美元起;推出自家首款折叠屏手机Google Pixel Fold,起售价为1799美元。


谷歌开发者大会.jpg


PaLM2的大型语言模型


和此前媒体曝光的消息一致,本次谷歌正式发布新的通用大语言模型PaLM 2。PaLM 2是驱动AI机器人Bard的模型的升级版,可以生成多种文本回应用户。谷歌称,它可以使用100种语言,擅长数学、软件开发、语言翻译推理和自然语言生成。



谷歌AI研究实验室DeepMind的副总裁Zoubin Ghahramani称PaLM2“比我们以前最先进的语言模型还好”,PaLM 2使用谷歌定制的AI芯片,比初版PaLM的运行效率更高。PaLM 2能使用Fortran等20多种编程语言,它还可以用100多种口头语言。


Ghahramani透露,现在约有20种谷歌的产品使用PaLM 2,轻量级的PaLM 2版本可以在移动设备上运行。


谷歌宣布,升级AI聊天机器人Bard,让它改由PaLM 2驱动,可以提供更高明的回复,从本周三起,让约180个国家地区的用户都可以开放申请使用Bard。


谷歌称,Bard的编程能力已经有所改善,Bard现在接入多种编程工具。Bard学习了C++、Go、Python等20多种编程语言,以及和谷歌表格(Google Sheets)的函数。


PaLM 2在医学等专业领域具有一些优势。它可以回答专家级别的体检问题。


AI 生成图像的真实性在未来可能会成为一个关注点。通过添加图像元数据,可以更轻松地识别合成图像。谷歌有另一个AI 模型 Gemini,它可以识别“合成生成的内容”,即由 AI 创建的文本、图像和镜头。Gemini 和其他AI模型将检查水印、即内容中集成的元数据,以及其他技术,告诉用户哪些是原始未变的,哪些是AI创造的。


谷歌聊天机器人Bard


谷歌产品主管、Bard的负责人Jack Krawczyk称,Bard将能够用英语、日语和韩语回复,谷歌将很快让Bard适用的语言达到40种。


Bard将很快在回复中包含图片,在接下来的几个月里,谷歌将使通过 Google Lens 工具,让Bard更容易回应用户的图片提示。比如,用户可以用智能手机指着满抽屉的艺术品和手工艺品工具和配件,问Bard它们可以用来做什么。


Krawczyk 说,未来Bard能将谷歌地图、文档、表格和 Gmail的信息带入对话中。Bard 还将能在 Adobe等第三方工具的帮助下回复用户。他提到Adobe的生成式 AI服务Firefly,说它可以根据文字描述创建图像。


Gmail、谷歌地图和相册的AI功能

同时,谷歌发布,旗下产品广泛应用AI技术的功能,从文档等各种协作工具、到电邮、搜索、云等各种服务一网打尽,让新型大模型支持的AI功能在各种产品中全面结合。


Gmail将利用生成式AI推出实现“帮我写”(Help Me Write)的功能,帮助用户写邮件。


例如,通过写一封信,获得航空公司的全额退款。谷歌有些设置能让生成的文本更长或更短,并且可以用之前的消息作为上下文,帮助AI编写内容。只要输入你想要的提示词,点击创建,就会出现一个完整的草稿。



谷歌地图将提供名为“沉浸式视图”(Immersive View)的AI工具。该工具将获取空气质量和天气的信息,为谷歌地图用户选出一条路线,并将路线可视化。沉浸式视图将在未来几个月内推广到十几个大城市。


谷歌CEO Pichai展示了一条位于曼哈顿的自行车骑行路线。用户可以看到,走这条路线,沿着西区高速公路骑车会有什么情景,其中有AI支持的交通、天气和路线本身的渲染图。从演示中可以看到具备了flyover功能,可以帮助将出行信息叠加到用户界面。


谷歌相册将推出名为“神奇编辑”(Magic Editor)的功能,用生成式AI 帮助用户重新构建照片,可以选择编辑照片的任何一部分,无论是画面的主角、天空还是背景,都可以编辑,可以抓取可以移除。


比如用户主要想拍的是瀑布,可以把瀑布边的人挪开些,拍照时人忘了取下背带,可以把拍到的背带抹去,可以把拍出的天空调得更明亮。


Workspace的Duet AI AI搜索功能Converse

谷歌称,谷歌的协作与生产力工具Workspace将很快能让用户借助AI生成完整的文档,并填写电子表格。这种AI服务名为Duet AI,将在今年晚些时候面向订阅者推出。


Duet AI可以让用户在文档、表格和幻灯片中融入AI服务。比如用户可以要求AI帮助撰写简历、整理企业图表或者为幻灯片生成图像,可以帮用户写文章和销售宣传材料,将它们放在谷歌文档中给所有人共享。谷歌幻灯片可以在App内生成AI图像。


谷歌为搜索服务推出了名为Converse的生成式AI功能。过去,用户想知道一个问题的回答,会在谷歌得到多个搜索结果,得自己综合这些结果。Converse可以为用户合成式的搜索结果。具体来说,它能提供一种“快照”,其中包括一些搜索结果文本或图片的生成式AI内容块,在它的下方是相关的链接。


谷歌称,Converse的搜索结果里会融入广告。和Workspace的一些AI功能一样,Converse 将提供一种“对话模式”,用户可以在其中“提出”后续问题。


谷歌云推出Duet AI服务和A3超级计算机虚拟机


谷歌云的CEO Thomas Kurian称,所有谷歌的云服务合作伙伴都可以付费使用谷歌的AI模型,以及算力。


今年夏季,连锁汉堡餐厅Wendy’s将运用谷歌的技术,在俄亥俄州的一家门店接受用户订单,避免用户排长队。谷歌强调,经过其调整的大语言模型可以理解Wendy’s的产品名,比如简称JBC的产品是一种培根芝士汉堡。


谷歌推出了一个名为Tailwind的项目。它可以记录开发者的笔记,并可以在云端网盘中整理不同的笔记。它还能建一个学习指南,提取笔记中的关键概念。用户您可以要求Tailwind 整理信息,或根据所做的笔记向它提问。 它也显示引用内容。


谷歌云还宣布,推出A3超级计算机虚拟机,旨在为语言模型提供优异的训练性能。这些虚拟机将搭载英伟达H100 GPU、第四代英特尔Xeon可扩展处理器,与谷歌专门的数据中心结合,可提供高达26 exaFlops 的算力,将有助于减少训练更大模型的时间和成本。


谷歌新手机Pixel 7a、首款可折叠手机Pixel Fold 平板电脑Pixel

谷歌还发布了两款手机,其中包括首次推出的可折叠手机Pixel Fold,同时开始预售新款平板电脑Pixel。谷歌确认,新版智能手表Wear OS 4将在今年晚些时候面世,同时会有一批Wear OS配套App和功能出炉。谷歌新一代安卓手机Pixel 7a,售价499美元,搭载谷歌自研的Tensor G2芯片,运行内存8GB,比Pixel 7和Pixel 7 Pro更平价。



相关阅读

美通胀数据温和,科技股造好,纳指涨1%


分享