虽然很难 中文智能语音技术终于取得突破

腾讯数码 2017-07-26

  腾讯数码讯(文心)据《麻省理工科技评论》网站报道,研究人员经常把2017年称作是中国的对话计算机年。利用语音识别和自然语言处理领域最近的技术进步,阿里巴巴和百度一直在开发能解决语音交流难题的技术。现在,利用阿里巴巴和百度技术、依靠语音操作的产品正在源源不断地推向市场。

  天猫精灵内置有阿里巴巴语音助手AliGenie,与亚马逊Echo智能音箱属于同一类产品。它能让用户通过语音网购、查看天气信息、播放喜欢的音乐、控制家中的其他智能家居设备。

  百度DuerOS对话平台已经被应用在家庭助手机器人、电视机顶盒和HTC智能手机中。它不但拥有与AliGenie和其他语音助手相似的功能,还具备随意聊天的能力。百度称,它收到大量DuerOS开发工具包订单。

  百度度秘事业部总经理景鲲预计,受Echo等产品在美国市场上成功的鼓舞,今年将有更多公司涉足这一领域。

  市场研究公司IDC预测,到2020年,中国51%的智能驾驶系统和68%的手机和可穿戴设备,将内置有具备对话能力的人工智能系统。景鲲说,就像触摸屏使得操作移动设备变得更容易一样,对话式界面将使人机交互更自然,吸引更多用户使用联网设备。

  《麻省理工科技评论》表示,基于语音的计算对于中国是一个不错的选项。目前,对于大多数用户来说,在QWERT键盘上输入中文字符都依靠拼音输入法。这种输入法依赖于汉字的发音,但由于汉语有四声、不同的声调有不同含义,在输入拼音字母后,用户必须费力地在一个下拉菜单中选择合适的汉字。像“yi”这个常见音节,对应着60个或更多常见汉字。部分输入法能根据最近使用的情况,使最常使用的汉字排在前面,但有时会出问题。意料之中的是,像微信这类移动应用的用户,更喜欢发送语音消息,而非像美国消息用户那样更喜欢输入文字。

  目前在中国,语音助手的作用是,把用户的语音命令转换为文本,然后根据文本含义作出回应。这一过程适合完成基于任务的命令——查看天气信息或查找某一汉语词汇的英文翻译,但它不能支持涉及多个话题、一问一答的对话。

  支持对话计算要求解决中文颇具挑战性的复杂性难题。例如,在中文中,相同的字符以不同顺序排列,就代表不同含义,即使以相同顺序排列,根据上下文,它们也可能有不同含义。另外,汉语在书写时不像英语有空格把单词分隔开。因此,中文自然语言处理研究人员必须教会他们的算法,在适当的地方插入空格,才能正确地理解特定汉字组合的含义。汉语缺乏动词时态——没有明确的形式表示过去、现在和将来的时间,给计算机理解一系列事件的先后顺序带来了挑战。

  中文自然语言处理研究人员还在解决其他挑战:大量的方言。

  研究自然语言理解的清华大学副教授吴志勇(Zhiyong Wu,音译)指出,计算机必须要获取一些细节,例如语调和重读音节,才能真正理解人说话的含义,并恰当地应对。

  为了提高其系统的智商,百度今年在其平台上引入“训练员”模式,让软件开发者通过聊天机器人实时贡献语言数据。聊天机器人会收到开发者的反馈(例如系统第一次没有能理解的一个问题的解释),进行学习,并纠正系统。

  《麻省理工科技评论》称,在尝试解决这些问题时,中国研究人员的一大优势是大量的数据。神经网络是当前计算机理解自然语言的基础,它需要有大量数据进行训练。一家公司掌握的数据越多,其神经网络就越聪明。阿里巴巴和百度等中国公司都拥有一个优势:庞大的用户群。截至2016年年底,百度月活跃手机用户为6.65亿;截至今年3月,阿里巴巴月活跃手机用户为5.07亿。

  但阿里巴巴人工智能实验室科学家王刚(Gang Wang,音译)表示,研究人员必须设计不需要大量数据进行训练的神经网络,才能提高它学习语言的效率。在实际生活中,人们会以不同方式表达相同的意思,把每种可能的表达方式都教会计算机是不可能的。以前做学术研究时,王刚及其同事提出了一种在只有少量数据的情况下教会计算机理解一个主题的方法:利用来自相关主题的数据。例如,要训练神经网络理解运动医学领域的语言,可以借用体育和医学领域的数据。王刚指出,这种方法的效果不如使用来自专门领域的数据,但是,在数据缺乏的情况下,也可以利用这种方法对神经网络进行训练。

  家用机器人创业公司小鱼在家创始人宋晨枫表示,最终,能使语音助手在中国获得成功的是内容和服务。宋晨枫计划逐步在小鱼在家的产品中整合教育和医疗内容。他指出,语音是向不能通过桌面计算机和智能手机上网的用户——尤其是老人和小孩,发布内容的一个途径。

责任编辑:王超

科普中国APP 科普中国微信 科普中国微博
腾讯数码
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢