想要了解谷歌智能语音助手Google Assistant的潜力,最好的方法之一就是看看其现在能多快地打开碧昂斯(Beyonce)的Instagram页面。谷歌项目经理梅吉·霍伦格(Meggie Hollenger)通过“Hey, Google”这个短语唤醒了其智能手机上的谷歌助手,然后开始了测试,连续快速地发出12个指令。
霍伦格的指令包括:“打开《纽约时报》、打开YouTube、打开Netflix、打开日历、设置5分钟的计时器、今天天气怎么样?明天呢?显示约翰·传奇(John Legend)的Twitter更新、显示碧昂斯的Instagram更新、打开手电筒、关掉手电筒、预定Uber网约车到我所在的酒店。”
伴随着霍伦格的每个指令,手机就会弹出相应新的信息,整个过程耗时41秒。她不需要在命令之间重复唤醒Google Assistant的短语。当她要求查看碧昂丝在做什么时,Google Assistant不仅会启动Instagram应用程序,还会自动把我们带到这位流行歌手的页面,这样你就能看到她与1.27亿粉丝分享的最新照片。同样地,当霍伦格要求使用Uber时,该软件已经知道她当前位置。
在谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)向世界推出其人工智能驱动的智能虚拟助理三年后,谷歌于美国当地时间周二的年度I/O开发者大会上预展了这款助理的“下一代升级”。Google Assistant现在可以比以前快10倍的速度提供答案。速度的大幅提升可能有助于扭转人们对语音助手过于迟缓和不准确的看法。如果像谷歌和亚马逊等公司想让这些数字助手进一步成为主流,这将是一件大事。
对于这家全球最大,每年提供超过1万亿次搜索答案的搜索服务公司来说,让Google Assistant获得成功至关重要。许多人不再通过在电脑上打字来查询信息,而是通过智能手机和智能音箱来交谈。谷歌现在正与亚马逊及其Alexa、苹果及其Siri展开竞争,以给我们带来我们越来越希望从始终连网设备中得到的即时满足。
为此,在年度I/O开发者大会几天前,谷歌邀请资深科技记者理查德·内瓦(Richard Nieva)前往其加州山景城(Mountain View)全球总部,首先浏览下其迄今为止对Google Assistant进行的最大升级,此举堪称“成败在此一搏”。升级后的Google Assistant很吸引人,但也有点儿吓人。
下一代数字助手成为谷歌推出诸多新功能中的焦点,这些功能展示了谷歌世界级的人工智能和工程能力。Google Assistant不仅速度更快,而且更加智能化,谷歌继续依靠过去五年在神经网络研究和语音识别方面取得的突破,将自己与竞争对手区分开来。
此外,Google Assistant越来越个人化。你将能够将家庭成员添加到亲密联系人列表中。例如,当你向Google Assistant问路想去你妈妈家的时候,它知道你妈妈是谁,住在哪里。去年推出的语音礼宾服务Duplex也有一个新功能,可以让Google Assistant在你口头提出租车或购买电影票等要求后,自动在网上填写表格。
Google Assistant产品副总裁曼努埃尔·布朗斯坦(Manuel Bronstein)表示:“我们可能会看到这样的全新世界,即与系统实际通话的速度要比打电话快得多。如果这种情况成为现实,或当这种情况发生时,你会看到更多的人参与进来。”
图2:Google Assistant产品副总裁曼努埃尔·布朗斯坦希望让语音搜索比打电话更快
但所有这些都凸显出这样的事实,即谷歌已经拥有了全球数十亿人的海量数据。该公司还强调称需要收集更多的个人信息,才能将Google Assistant的真正愿景变为现实。目前,Google Assistant已在10亿部设备上被使用,主要是因为它预装在运行全球最流行移动操作系统安卓(Android)的手机上。
此外,谷歌的许多其他服务,比如Gmail、YouTube、地图和Chrome浏览器,每月也为超过10亿人提供服务。所有这些服务都是有用的和创新的,但它们的命脉是你每天通过搜索历史、电子邮件收件箱、视频浏览习惯和驾驶方向向该公司提供的数据。
当然,这一切都需要以Google Assistant真正发挥作用为前提。谷歌不允许内瓦及其同事亲自体验其语音助手,也不允许他们录制演示视频。相反,谷歌为他们提供了预先拍摄的营销视频。霍伦格还根据预先编写的命令备忘单读取脚本。因此,在手机和智能家居设备上执行普通人漫不经心的请求时,目前还无法知道这款软件的灵活性有多强。
值得注意的是,演示过程中也出现了一些错误。虽然从一个应用程序跳转到另一个应用程序非常快,但霍伦格不得不重复一两次查询,因为Google Assistant在第一次尝试时没有处理她的请求。不过,在其他演示中,霍伦格使用Google Assistant以极高的准确度口述文本和电子邮件。该系统还能分辨出她想要在电子邮件中写什么,以及什么是通用命令。例如,当她说“发送它”时,Google Assistant就会发送电子邮件,而不是在电子邮件正文中键入“发送它”这样的字眼儿。
不过,Google Assistant肯定会成为讨论的主题,或许还会引发争议。阿斯彭科技政策中心(Aspen Tech Policy Hub)主任贝琪·库珀(Betsy Cooper)表示:“这其中有积极的一面,也有消极的一面,还有利弊权衡。有了Google Assistant,因为它总是处于倾听状态(捕捉唤醒短语),它有可能会滥用这种特权。”
打造个性化谷歌
谷歌首席科学家弗兰西斯科·比菲斯(Francoise Beaufays)表示,新的Google Assistant是他们五年辛勤工作的硕果,这比该软件问世的时间还长。在这五年中,谷歌研究人员在人工智能音频、语音、语言识别和语音控制方面取得了关键进展。比菲斯称:“我们所做的是彻底改造整个堆栈,使用一个神经网络来做所有的事情。”
这是一项重大的技术突破,将所需的空间从100GB降低到不足0.5GB。不过,这款升级版的数字助手需要智能手机具备强大的计算能力,因此只能在高端设备上使用。谷歌将在其旗舰手机Pixel的下一个高端版本上推出这款产品,预计Pixel将于今年秋季推出。
在2016年5月推出Google Assistant的几天前,内瓦和皮查伊在他那间玻璃墙的办公室里坐了下来,聆听后者的推介。这家搜索巨头在数字语音助手领域已经落后多年,现在终于准备好与Siri和Alexa展开竞争。对于谷歌来说,Google Assistant就是要突破公司标志性的白色主页,把它的工程学智慧渗透到你所拥有的每一项技术中——手机、汽车甚至洗衣机中。
皮查伊当时称:“这是谷歌在问用户:‘嗨。我能帮什么忙?’把它想象成建立你自己的谷歌。”现在,皮查伊为Google Assistant开启了一个新阶段,包括了解你家庭具体细节的功能,且比以往任何时候都更清楚地表明,当他说“打造个性化谷歌”时,他是认真的。谷歌不会让皮查伊接受采访。
时代变化
当然,现在的世界与三年前大不相同。
首先,谷歌与亚马逊的竞争如今已经是一场全面竞争。市场研究公司eMarketer的数据显示,在智能音箱方面,亚马逊的Alexa Echo设备占据了近67%的市场份额,而由Google Assistant驱动的Google Home占比近30%。谷歌今天发布了Nest Hub Max,这是一款内置Google Assistant的10英寸智能显示屏。
然后是关于隐私和安全的公开辩论。在社交网络巨头Facebook的剑桥分析公司(Cambridge Analytica)滥用数据丑闻发生之后,立法者和消费者对大型科技公司的政策更加关注,并将数据收集问题推到了风口浪尖上。就在上个月,谷歌还因为其Sensorvault数据库而受到批评,该数据库可以根据谷歌对你个人信息的了解,帮助衡量其利润丰厚的定向广告的有效性。
事实证明,全美各地的警察部门在试图破解犯罪调查时,都曾利用Sensorvault获取位置数据。作为回应,美国众议院下属的一个委员会致信皮查伊,要求就数据库问题给出答案。议员们要求在5月10日前举行一次现场简报会。
图3:谷歌首席科学家弗兰西斯科·比菲斯表示,新一代Google Assistant背后的研究可以追溯到5年前
上周,谷歌被问及:如果执法部门要求谷歌提供家庭关系数据和Google Assistant收集的其他信息时,谷歌会怎么做?Google Assistant产品副总裁布朗斯坦表示,谷歌在为广告目的存储数据方面一直存在“非常好的争论”。他说,公司的理念是“不要为了存储信息而存储信息,而是要为能带来价值而存储。我们希望所有这些事情都能保持透明,这样你就能知道什么时候这些信息被用来做广告,或者永远不会被用于广告。”
但隐私专家表示,谷歌应该更好地向消费者传达其政策。斯坦福大学互联网与社会中心消费者隐私主管珍·金(Jen King)说:“我不知道人们实际上对此理解得有多透彻。”她补充说,谷歌应该给人们更多的选择,让他们选择是否参与数据收集,而不是把事情混为一谈。
谷歌在如何处理透明度方面已经受到挑战。去年,美联社报道称,谷歌甚至在人们关掉智能手机上的位置共享功能后,仍能追踪他们的位置。这些数据是通过名为“位置历史”的谷歌地图功能存储的,这与Sensorvault数据库中的功能相同。美国公民自由联盟(ACLU)等批评人士表示,谷歌披露的信息并不诚实。该公司后来在其网站上修改了此前的帮助页面,以澄清设置是如何工作的。上周,谷歌宣布了一项功能,允许人们自动删除位置、网页和应用程序历史。
布朗斯坦还表示,如果用户在设置中允许的话,来自Google Assistant的“一小部分”语音查询将与谷歌的一个团队共享,该团队致力于改进人工智能系统。他没有提供任何关于“被分享语音记录有多小”的细节。但他说,在这些情况下,个人信息被从语音音频中剥离。
Duplex的演化
除了Google Assistant带来速度上的震撼外,谷歌还在更新去年引发最大争议的项目——Duplex。该功能使用听起来令人不安的人工智能软件,代表Google Assistant用户打电话进行服务预订和预约。它的人工智能可以模仿人类的语言,使用像“uh”和“um”这样的口头语。它说话的节奏就像真人一样,在回答问题前停顿一下,拉长某些单词发音,好像是在争取时间思考。
去年的演示立即为人工智能伦理学家、行业观察人士和消费者敲响了警钟,他们担心这款机器人具有欺骗人类的能力。谷歌后来表示,它将增加信息披露,这样人们就会知道他们在与自动软件对话。这次新的迭代要温和得多。
图4:谷歌Duplex获得升级,增加了许多新功能
谷歌周二更新了Duplex功能,以简化租车和购买电影票等更多类型预订的流程。但这一次没有说话听起来像人类的机器人,它基本上自动完成了你在移动网络上可以找到的表单填写过程。你可以这样说:“Hey Google,下次旅程为我从National租车公司租辆车。”然后,Google Assistant会在你的手机上打开National的网站,开始实时填写这些字段。
在整个过程中,你将看到一个进度条,就像下载文件时看到的那样。当Duplex需要更多信息时,比如价格或座位选择,进程会暂停并提示你进行选择。填好表格后,点击确认预订或付款即可。与其他Google Assistant功能一样,该系统使用从日历、Gmail收件箱和Chrome自动填充(包括信用卡信息)中挑选的数据来填写表单。今年晚些时候,这一更新将在安卓手机上推出。
Google Assistant工程主管斯科特·霍夫曼(Scott Huffman)今年早些时候曾说过,尽管这一版本可能会造成较少的反冲,但去年广泛的争议对谷歌来说是一个关键时刻。他说:“人们的反应强度让我吃惊,这让我们清楚地看到,这些社会问题未来会有多么重要。”
Google Assistant也有其他的事情要处理。谷歌周二还推出了一款新的安卓手机“驾驶模式”。当你激活它时,用户界面会将一些你可能在开车时使用的项目放在前面和中间位置。这些功能包括谷歌地图、Waze导航导航、音乐控制以及来电提醒等。当你启动导航功能后,音乐或电话控制就会出现在屏幕的底部,这样你就不用摆弄手机来找它们了。
道路规则
总的来说,谷歌的新智能助手公告可能会对我们如何使用科技产品和服务产生重大影响。让语音命令变得更简单、快捷,可能会改变我们与设备的互动方式,就像十多年前以苹果iPhone为首的智能手机成为主流,并引发触摸屏时代到来一样。也许我们可以把这看作是迈向人类不断与无生命物体对话世界的第一步。
图5:Google Assistant的“驾驶模式”突出导航和音乐功能
谷歌下一代Google Assistant还可以为培养语音查询的新习惯打下基础。去年,谷歌宣布了语音命令的“继续对话”功能,它可以在用户提出问题后将麦克风打开8秒钟,这样用户就可以继续提问。下一代Google Assistant已经基于这一概念改进,最终可能为摆脱唤醒短语开辟一条道路。
这种开放式麦克风可能会引发对隐私的担忧。布朗斯坦说,把麦克风打开一段时间是有帮助的(公司还在调整这段时间的长短),但他希望人们在说话时“能保持相关意识”。他说:“你不一定想让这个东西把你说的话都抄录下来,因为你会觉得不舒服。”
谷歌还有许多其他方式可以提升Google Assistant。霍夫曼今年早些时候曾说,他有兴趣让这款软件记住你昨天和它进行的一次确切讨论,这样今天你就可以从你们上次讨论的地方继续。他甚至希望Google Assistant能够检测你的情绪和语调。
不管这是否令人恐惧,这就是谷歌如何考虑改进Google Assistant的方式。不过,布朗斯坦表示,目前他的重点是让用户体验变得更加无缝,并在添加这些面向未来的功能之前弄清楚哪些功能对用户更有价值。
与此同时,人们将不得不解决大规模数据收集和比以往任何时候都要聪明的技术所带来的各种问题,谷歌知道这一点。正如霍夫曼早些时候所说的那样:“有了人工智能,我们最终会让社会思考一些道路规则。”
Google Assistant 和其他语音助手相比有什么亮点吗
我在周末体验了搭载Google 人工智能技术的Allo 之后,得出如题的结论,事实上,不只是我有这样的感觉,最近还有许多科技大佬和发烧友做了几款人工智能助手产品的对比测评,都对Allo的表现略微失望,竟然是百度的度秘压过了它成了大黑马,包括《纽约时报》记者在尝试了Allo五天以后,给出的结论也是:谷歌这个助手真的有待改进。
Allo早在今年5月的Google I/O大会上就已推出。这场大会的关键词是人工智能,最能体现“人工智能”元素的应用就是“Google Assitant(谷歌助理)”,Allo是消息聊天应用,与Facebook Messager、微信等聊天应用最大不同是整合了Google Assitant。跟中国的阿里巴巴一样,Google在社交这个事情上一直在努力,从来没成功,从IM时代的GTalk再到SNS时代的Google+,均惨淡收场,这一次携着人工智能技术通过Allo再战社交市场。
Allo能做什么?Google官方宣称,它整合了智能回复功能和Google助理,“让数字助理变成真人助理”是这款软件的初衷。在发布会上Google I/O演示了Allo智能回复朋友的信息,点评收到的照片,而Google助理则可在群聊时帮助用户预订意大利菜。真正的体验是怎样的呢?Allo 上周登陆了Google Play和AppStore,眼下对英语支持比较好,但也支持中文,先来看看上手体验。
判断人工智能助理的能力一般可从三个方面来看:一是“听懂人话”即理解用户意图的能力;二是“给出答案”即能让用户感受到它的聪明机智;三是“完成任务”即是否可在给出答案之外提供信息之外的服务。图灵测试是计算机历史上的经典测试,“如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。”现在AI助理通过图灵测试太容易,但要100%像人一样给出答案,尤其是100%像人一样完成任务,就太难了。Allo的“真人助理”理念很好,但其能力却距离一个合格的“数字助理”都还有差距。
Google助理:理想很丰满,现实很骨感
Allo是一个消息聊天应用,你可以跟朋友发送表情、文字、照片、位置等信息,前提是对方也要安装并登录Allo,Allo与通讯录打通,让用户可方便地邀请好友使用Allo。而要使用其“智能助理”功能,即可在聊天时@Google,也可与其内置的联系人Google Assitant(Google助理)对话。Google Assitant(Google助理)会在用户首次点开之后进行引导,告诉用户有订阅、运动、旅行、外出、新闻、笑话、游戏、行动、翻译、天气、问答等11大场景。
与Google助理的对话界面,与普通联系人对话界面没有什么区别,支持文字、语音、图片等类型的消息格式。在听懂人话方面,Google助理基于Google在自然语言处理和Google Now在语音技术上的积累,表现还是不错的。我说英语,说中文,它基本都可听懂,对于比较复杂的句式能很好地理解,你可以给Google助理发送一张鸟儿的图片,它可准确地识别出来,在你继续提问时,就给你WIKI百科的词条。
在给出答案这一点上,Google助理很依赖搜索引擎。说附近好玩的、附近的饭店、附近的星巴克,都会收到Google地图的搜索结果。如果说来一个好看的视频,会收到Youtube的一个视频,支持评分、随机、最新等方式。如果问最近的电影,它会给你一组电影海报和名称,点击之后又是搜索结果。总的来说,在答案上,Google助理非常依赖搜索,且用户点击之后,都会调用Chrome浏览器打开,没有实现内容的内嵌,体验不好,感觉Google助理就是搜索导流工具,十分依赖Google搜索并且还要用浏览器打开结果。
google assistant 是这东西吗
google assistant是什么 谷歌assistant语音助手介绍
作者:佚名 来源:绿茶软件园 2016-05-20 17:24:44 0
google assistant是什么?google assistant是一款语音助手,在谷歌I/O2016大会上推出。下文带来谷歌assistant语音助手介绍,一起和小乐哥来了解下吧!
产品功能
google assistant并不是一种单独的程序,这款新的技术会和谷歌不同的设备以及操作系统机密结合。
谷歌CEO皮查伊将google assistant比喻为“一种跨越设备间的体验”,旨在让用户通过“流畅”的语音和设备相互沟通。
google assistant也能够使用在第三方的应用和服务中,例如流媒体音乐服务、打车服务等。
发展经历
2016年5月19日,在谷歌I/O大会上,谷歌CEO皮查伊发布谷歌的语音智能助手google assistant。
2020CES 5G和自动驾驶到来后,我们需要怎样的车内语音交互?
文/BY
谷歌和亚马逊的生态商之战
整个CES期间,拉斯维加斯随处可见“Hey Google!”的广告,毫无疑问,Google Assistant语音助手是谷歌是本届CES的展示重点。随着手机、PC上语音助手业务的下滑,及5G刺激下物联网对语音助手需求的激增,谷歌计划将语音助手的主战场转移至汽车和智能家居上。
在Google Assistant展台,停放着一辆宝马X5和一辆沃尔沃XC40,分别通过Android auto手机映射和Android OS内置车机,集成了Google Assistant语言助手服务。体验下来,Google Assistant依然停留在生态商将应用从手机移植到车内的水平,例如通过唤醒,它能够帮助车主实现连续多目的地导航,控制娱乐系统及连接的智能家居,不得不说的是,Google Assistant体验下来约等于一年前国内百度语音的水平,具体体验可观看下方视频。
Google Assistant最直接的竞争对手是亚马逊Alexa,此前搭载Alexa的亚马逊智能音响在海外占据庞大的市场,而随着5G与物联网业务的兴起,亚马逊也正着力于将Alexa植入到汽车及智能家居中。在本届CES上,亚马逊展示了Alexa Auto语音助手,该语言助手会集成到自家电动皮卡Rivian的全系产品中,此外,兰博基尼、通用也将集成Alexa Auto。
与谷歌类似,Alexa Auto的功能同样集中在将亚马逊生态从手机、音响移植到车内,这包括了亚马逊的云计算、娱乐系统、购物及支付。单就打通语音端和支付端这一点来看,Alexa Auto堪称目前世界上技术含量最高的语音助手系统。
科技公司更专注用户体验
如果摆脱生态思维的束缚,车内的语言交互又会是怎样的表现呢?本届CES还有一家专注车内语音交互的科技公司——Cerence,准确来说,这是一家致力于“软件定义未来出行工具”的软件科技公司。Cerence通过ARK、e.GO Mover自动驾驶巴士、Cerence Drive三项产品展示,解答了上述问题。
先说最让人眼前一亮的Cerence Drive无按键智能座舱。通过一块大屏和演示车的配合,Cerence展示出最新多模态自然交互、视线识别、应急车辆检测等功能。2019年第三季度我在上海看到Cerence的多模态自然交互演示时,该功能还停留在“PPT”阶段,而时隔不久的CES,便已能在车上实际感受该功能了。
所谓多模态交互,可以理解为借助语音、视线捕捉、手势识别等多种方式来共同完成交互。例如,我可以看着驾驶员一侧的车窗说“把它关上”,驾驶员一侧的车窗就会关闭。再比如我路过某家餐厅时盯着窗外那家店面,问这家店好不好吃?就会得到这家店的大众点评评分等信息,并给出相应建议。
相较2019年的演示,本次演示的多模态交互还新增了手势、视线识别在智能挡风玻璃上的交互应用。主驾驶可以使用手势来移动、选择在挡风玻璃上显示的部件,进行分段式路线导航、音乐播放、查询天气等操作。例如,驾驶者使用抓取-投掷手势并结合凝视的方式,将导航窗口移动至副驾面前的挡风玻璃处,实现座舱内的互动。新增的功能主要将应用在逐步到来的L3自动驾驶车辆上。
Cerence展台还展示了一辆e.GO Mover自动驾驶巴士,用以演示L4级自动驾驶巴士与乘客及行人的交互。帮助消费者了解未来如何安全高效地与自动驾驶汽车进行沟通。通过多语言自动语音识别和自然语言理解技术,乘客和行人可以使用母语与汽车进行对话式的互动,例如可以询问这辆车是去哪儿,会不会路过你要去的地方?演示车的语言还运用了情感TTS,例如,重要通知可以用更加紧急的语气表述,而延误信息可以用包含歉意的声音传达。
最后要介绍的ARK,是一套可快速部署的语音AI交钥匙解决方案。Cerence ARK集成了唤醒词、声纹验证、自动语音识别、自然语言理解和文字转语音等领先功能,并具有开放、灵活和快速部署的优势。通过体验可以发现,这套语言已经淡化了生态APP的存在感,而更多基于人的实际需求来提供服务,跳过中间环节,直接输出用户最需要的结果。
5G、自动驾驶等技术,为车内人机交互带来了新的想象空间。目前来看,谷歌、亚马逊等互联网巨头在整合生态服务上有着巨大的优势,凭借这样的优势,互联网巨头们的语言助手可以快速上车,并提供一系列新奇的前所未有的应用。这些应用会包括在线听歌看剧、控制智能家居、网上购物等,新奇却缺乏想象力。
与谷歌和亚马逊不同,Cerence的切入点在于如何提升用户的交互体验,解决用户每个阶段最迫切的实际需求。短期内,相对封闭的生态确实会让Cerence这类专注技术的科技公司处于不利地位,毕竟,那种“更接近人与人交谈”的交互体验,没准两年以后谷歌和亚马逊也可以做到。
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。