为什么AI能在围棋界称雄却无法攻克翻译高地?

腾讯科技 2017-05-26 作者:锐志

  【腾讯科技编者按】科技博客VentureBeat近日撰文称,近些年来,人工智能已经从理论应用领域破壳而出,机器学习技术渗入了智能汽车、视频游戏、数字营销、虚拟助手和聊天机器人等产品。随着AI影响力的不断扩张,它们会继续打破原有力量平衡,让某些行业旧貌换新颜。今天下午,柯洁在与AlphaGo的第二局比赛中投子认输,机器已经彻底笑傲棋坛。不过,在最近今年2月的另一场翻译人机大战中,AI却没能战胜人类。那么,未来机器同样会让人类翻译失业,搭起全人类无障碍交流的“巴别塔”吗?

  棋类游戏人类全面溃退

  想得到这个答案,我们必须先了解AI和机器学习是如何一步步战胜人类的。1996年, IBM的深蓝电脑首次挑战国际象棋大师卡斯帕罗夫,初次交手卡斯帕罗夫获胜。不过,沉寂一年后卷土重来的深蓝却赢了第二场比赛。在那之后,计算机又有了长足的发展,国际象棋领域,人类已经再难与其叫阵。

  深蓝挑战卡斯帕罗夫20年后,AlphaGo横空出世,它在最难攻克的围棋上4;1战胜了韩国高手李世石,惊掉了全世界的下巴。随后,AlphaGo又化身Master,在互联网上取得了60场不败的战绩。而今天,升级版的AlphaGo在比赛中已经2:0领先柯洁。

  机器翻译已经发展到3.0时代

  现在,业界开始将翻译看成下一个突破口。语言的生成和翻译对机器来说一直是最复杂的挑战,上世纪50年代IBM就试图打破这一藩篱,但直到上世纪90年代,搜索引擎Altavista才推出了真正的翻译工具。不过,机器翻译有自己的局限,它只能“翻字典”逐个单词进行翻译,缺乏背景知识的它大多数时候翻译出来的都不像人话。

  机器翻译之后,我们进入了统计机器翻译(SMT)时代。它会利用模型将语段中的单词或句子与此前的翻译进行对比,然后再找出最合适的表达方法。

  随着机器学习和AI的介入,机器翻译将进入第三个阶段。与人类大脑类似,机器需要在语境背景下理解不同句段的使用方法,随着学习的深入,它们也能生成可理解的目标语言。

  为此, 谷歌专门开发了神经机器翻译(NMT)技术,该技术会以整个句子为单位进行理解(此前为单词和词组)。在AI的助力下,NMT也能从翻译资料中汲取“养料”,它能快速分析语段结构并发现语义或结构转换的微妙之处。

  短期内人类翻译不会丢饭碗

  技术进步飞快,许多靠语言吃饭的人开始担心NMT带来的巨大威胁,但对于普罗大众来说,能打破语言的藩篱确实令人期待。

  今年2月份,谷歌全新NMT系统在韩国世宗大学与人类译员进行了一场大战。整个比赛耗时50分钟,人类和机器都要翻译两段随机文本(未翻译过的),一段文学的,一段非文学的。在这次比赛中,人类以巨大优势战胜了机器,韩译英和英译韩上机器都没占到半点便宜。

  有人会说,翻译可不像数学计算或者下围棋,评委在评判时可能会戴着有色眼镜。不过,这次比赛第三方裁判主要着眼于母语者一眼就能看出的语言错误,因此我们没有理由怀疑比赛的公平性。

  赛后,评委表示,NMT系统翻译出的文本90%语法都有问题,或者说它会翻译出一些没有明显错误但不符合人类语言习惯的语句。这场大战后,许多靠语言吃饭的人都能松口气了。

  不过从长远来看,NMT未来确实可以胜任一些技术类的文本内容,此类文本有严格的写作规范且术语众多。当然,即使是此类文本,NMT翻译后人类也要对其进行一定的校对和修改。

  至于文学和营销翻译,恐怕最先进的AI也无能为力,因为此类文本的译文需要翻译根据实际情况进行再创造(如 苹果“Think Different”的广告语翻译成“非同凡想”)。因此,在翻译和语言的世界中,机器人还有很长的路要走。

责任编辑:王超

科普中国APP 科普中国微信 科普中国微博
腾讯科技
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢