让人工智能语音助手听上去像人类 这是好事吗?

网易科技 2017-05-16

  《连线》网站撰文称,数字助手的声音听上去很像是人类,就是好事情吗?那的确可能会使得人们更想要使用它,但也可能会带来意想不到的影响:助手的功能变弱,变得没那么有用。这提出了一个重要的问题:人们究竟想要从虚拟助手那里得到什么呢?

  以下是文章主要内容:

  向Alexa询问天气状况,它会用愉快的音调告诉你天气晴朗。让它给你讲个笑话,它就会用它标志性的断奏给你讲个双关笑话。叫它唱首歌,它就会唱出自动调谐的民谣。亚马逊的虚拟助手拥有着各种各样像人类的机灵功能——但它的声音出卖了它:Alexa还只是个机器人。

  为了帮助Alexa摆脱机器人口音,亚马逊最近升级了它的语音合成标记语言标签,让开发者能够用来给Alexa的技能或者应用编造出更加自然的语音模式。那些新标签可让Alexa做各种口头活动,如低声说话,停顿,爆出咒骂的话,调整语音的速度、音量、语气强调和音高。这意味着Alexa和其它的数字助手可能不久之后就会听上去不那么像是机器人,而更像是人类。但在这两个极端之间取得良好的平衡对于语音交互设计师而言仍是一大挑战,且提出了人们真正想要从语音助手那里得到什么的重要问题。

  让表达更加细致入微

  先进的语言标签之于计算机生成的语音的作用,就像是标点符号和表情符号之于文本通讯的作用:增加信息的带宽。简单的标记语言可让语音助手区分1996和1,996,或者区分相同发音的单词不同的用法。先进的标签可让它们传达比以往多得多的信息。你知道你是如何看待“听起来不错”短信和带表情符号的“听起来不错”短信之间的差异的吗?发出抑扬之声的能力也将让数字助手能够做出细致入微的表达。

  更加细致的助手可能会更有帮助。俄亥俄州立大学语音心理学家劳拉·瓦格纳(Laura Wagner)表示,“声音的音乐要素有助于你形成一种期待。”语音的抑扬可带来更加高效的描述,减少歧义性。它还有望给Alexa带来相对于来自苹果和谷歌的数字助手的情感优势。“如果它听上去像人的话,我们会很喜欢它。”瓦格纳说道。有证据显示,人们对于能够“随即地进行互动”(即能够跟另一个人进行响应式的来回交谈)的物体有更强的连接。“Alexa听上去越像人,我就越想要信任她,越想要使用她。”瓦格纳说。

  当然,那也解释了为什么亚马逊想要让Alexa听上去尽可能地像是人类。

  功能或弱化

  不过,亚马逊也面临着让Alexa听上去太像人的风险。2月,该公司发布了“speechcon”——数十个Alexa能够更加准确地发音的感叹词,如argh(哎啊)、cheerio(好呀)和d’oh。亚马逊想要给它的虚拟助手加上一层个性,但像那样的怪异模式会让Alexa变得没那么有用。

  卡内基梅隆大学计算机科学家阿兰·布莱克(Alan Black)表示,“如果Alexa开始说出诸如‘hmm’和‘well’的话时,你会不自觉地跟着她那么说话。”布莱克在1990年代帮助开辟了语音合成标记标签的应用。人往往会不自觉地模仿对话者的会话风格;让数字助手的说话方式变得太随便的话,人们也会跟着那么说话。“这样的代价就是,数字助手可能会听不出用户在说些什么。”布莱克说。

  以功能弱化为代价来改进语音助手的个性,是越来越多的用户界面设计师们将要解决的一个折中问题。旧金山设计咨询公司Fjord的聊天机器人设计师约翰·琼斯(John Jones)说道,“我们是想要说话的个性,还是想要给予我们信息的实用功能?我想很多情况下我们都会更想要可给给予我们信息的实用功能。”仅仅因为Alexa能够说出俗语和流行文化用语来,并不意味着它应该那么做。有时候你只希望它能够带来效用。数字助手应当用简短的回复来回应直接的指令,又或许直接沉默不语——而不是发出“booyah”(一种喜悦的叫法)的声音。(亚马逊添加的另一个speechcon。)

  个性和实用性倒不是相互排斥的。你或许听说过形式服从功能这一设计准则。Alexa没有物质形态可言,但它的用途应当能够代表它的外在形象。但数字助手的理解能力仍然太过基础,因而无法鱼与熊掌兼得。《对话界面》(Conversational Interface)合著者迈克尔·麦克蒂尔(Michael McTear)指出,“如果数字助手的语音做得很像人类,那可能会让用户觉得该技术所有其它的元素也都同样出色。”数字助手声音听起来如何和它能够做的事情之间的鸿沟越大,那它的能力和用户对它的期望之间的落差就越大。

  人们想要从虚拟助手那里得到什么?

  这提出了一个重要的问题:人们想要从虚拟助手那里得到什么?毕竟,交互设计师的诉求应当要反映用户的诉求——但你会在想谁能够从他们所做的变化中获益最多。亚马逊让Alexa听上去尽可能地像是人类的努力表明,用户希望他们的人工智能伙伴能够不仅仅帮助他们关灯或者带来天气预报。他们希望这些设备能够理解他们,能够与他们建立情感连接,甚至可能跟他们约会。

  但忽视开发这些产品的公司背后的动机会是幼稚而不现实的。亚马逊想要向你销售东西(毕竟,它的设计准则是将Alexa所有者鉴定为“顾客”而非“用户”),感情表现力更强的数字助手可用来帮助达到那个目的。亚马逊已经在尝试采集来自Alexa用户语音的情绪信息;理所当然地,情感表现能力更强的人工智能也将能够更好地分析——以及操控——你的情感。

  是的,这听上去让人毛骨悚然,但同时也很有前景。亚马逊或许会利用Alexa的情感表现能力来向你卖东西,但社交用的机器人也许可以利用同样的技术来给老年人提供更好更周到的照顾。随着开发商继续使得数字助手听上去没那么机械呆板的进程,机器人的实用性和陪伴属性之间的界线将会变得越来越模糊。未来Alexa是否将会变得像是一个拥有情感智能的朋友呢?也许吧。亚马逊距离打造出能够预测你的需求和欲望的虚拟助手仍相距甚远;在此之前,它还面临着诸多有助重塑这些助手融入你的生活的方式的未解问题。

责任编辑:王超

科普中国APP 科普中国微信 科普中国微博
网易科技
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢