timg.jpg

AI那厮:新理论该怎么为概念下定义?

返朴 2019-04-17 作者:王培

  一个好的工作定义的终极标准是在其基础上建立的理论所能达到的高度。

  撰文 | 王培(美国天普大学计算机与信息科学系)

  人工智能的定义是一个已经被说到倒胃口但又常常不得不重拾的话题。在1950年,图灵的文章《计算机与智能》建议通过行为来界定“思维”和“智能”,就此拉开了人工智能的序幕。后面几十年各路人物轮番登台,但至今就这场大戏的主题尚欠共识。时至去年,一个德国研究中心还收集了几百个对“智能”的定义。由于谁也说服不了谁,大部分人已经觉得这种讨论纯属浪费时间。但在另一方面,这个领域中几乎所有重大分歧最后都会归结到对“人工智能”的不同理解,所以这个问题又无法被忽视。如果说这以前还基本是个理论问题,现在可是要成为社会问题了。比如说,现在各国政府都在筹划对人工智能的应对方案,但如果连对象是什么都说不清,政策就很难搞对路了。

  既然如此,为什么不先把定义搞清楚呢?这就要从“定义”是怎么回事说起了。这事还真不像乍看上去这么容易。不服气的读者可以看下去,如果后面的问题您都有高招,再嘲笑我们低能不迟。

  靠“实力”反抗定义

  从小学开始我们就知道一个词的“定义”确定了它的意义,因此为其使用提供了标准。这些定义都在字典和词典里列出来了,大家背下来就是了,照着用就是了。但字典定义又是哪里来的呢?据说是按照字词的当前使用习惯整理的。这岂不是“鸡生蛋还是蛋生鸡”的问题又来了。

  从认知科学的角度看,词语的主要功能是在通讯交流中表达概念,所以词语的意义还是来自概念的意义。我在《“意思”是什么意思?》里面介绍过几种意义理论,这里就不重复了。简单说来,由于概念的意义依赖于经验,同一个词语(及它所表达的概念)在不同的人的心目中有不同的意义就是必然和正常的了。我们的思想和语言都是在不断发展的,而这种发展的一个重要方面就是意义的变化。现在还时不时有人用某个词的“古义”来贬损其“今义”,这就是对语言的本性缺乏了解了。即使是同一个人使用同一个词,在不同时刻也会有意义变化,就更不必说不同的人了。

  但这个问题自然还有另一方面。既然语言的首要功能是通讯,那么参与的各方要对所用的词语意义有大致的共识或约定,否则就成了鸡对鸭讲了。下定义、编字典都是建立这种约定的努力。在交流过程中,人们也会根据交流对象选择词汇,并澄清它们的意义,以达到预想的交流效果。总的说来,定义当然是个好东西,但这不是说没有公认定义的词语就没有意义,或者说背离字典定义的用法都是不合理性的。

  词义的变化总是从某个人开始的,而如果一个“新意”得到越来越多的人的接受,它就会逐渐流传开来,以至于最终代替“原意”。在交流过程中,这类“发明”有导致误解或不解的风险,因此大多数不会广泛流传以至于成为普遍标准的一部分,而是成为一个小圈子的内部约定,尽管这种约定的实际力量往往比字典定义还要强大。鲁迅在《阿Q正传》就提到了这种现象:“加以进了几回城,阿Q自然更自负,然而他又很鄙薄城里人,譬如用三尺三寸宽的木板做成的凳子,未庄人叫“长凳”,他也叫“长凳”,城里人却叫“条凳”,他想:这是错的,可笑!”。不难想象,某些城里人也会在同一个问题上嘲笑未庄人。

  在人工智能的定义上也有这种“相互鄙视”。业外人士常常嘲笑人工智能专家们吹牛甚至说谎:“就你们做的那个东西还算有智能?”;而业内人士则认为外行们在自曝无知:“人工智能就是我们说的这个意思,你们不了解就别乱说!”双方都理直气壮。刘易斯·卡罗尔在《爱丽丝镜中奇遇记》中描述了一个矮胖子Humpty Dumpty,他曾自得地宣称“当我用一个词的时候,它总是正好表达我要表达的意思,既不多也不少。”这种人在很多争论的双方都能见到,他们总觉得自己是在使用某词的“正确的意思”,而很少考虑为什么对方不这么看。

  其实在和定义有关的对抗中,“造反”(违反或修改定义)和“镇压”(确立和维护定义)都具有合理性,而最后就是“成王败寇”。这样说不是简单地各打五十大板以示公平,而是说对一个具体的“违规”的赏罚最后实际上是双方角力的结果,没有一方有天然的正确性。“尊重传统”和“与时俱进”都有个限度问题。

  聊天机器不会“聊天”

  虽然上面的话像是常识,但若依此考量在自然语言理解方面的工作,仍能看出不少问题来。在早期“基于规则”的方案中,大多是想通过给每个词下定义来掌握其意义,尽管很多定义是隐含的,即是通过系统对有关词汇的处理体现的。这类方案的问题是很多词极难定义,即使在字典里也往往是罗列了其若干不同意义,而没有说怎么在具体情境下消除歧义。近年来这个领域转向依赖于统计各个词汇的具体使用方式,因此不再要求事先给出定义。这样做更加简单实用,但词汇的“定义”其实还在,只是表现为该词汇在所用的训练数据集中的统计特征。

  从应用的角度来看,这种做法对很多产品来说已经足够好。以机器翻译为例,如果只是要将旅游者“附近有中餐馆吗?”之类的句子译成不同的语言,我们大可以认为每个句子有一个特定的意义,而翻译程序只是需要把这个意义在其它语言中表达出来就是了。但对另外一些应用来说,字句的意义不再是固定的,而是随时间、地点等而变。这就超出统计方案的能力范围了(即使加上条件概率也远远不够)。从根本上说,应该把字句的意义看成可变的,而“定义”(包括统计性的)只是其中相对稳定和基本的成分。

  与此相关的是对话的生成和理解。现在的“聊天机器人”都是基于统计学习的,其目标是“听上去像人”,所以在产生每句话时的设计目标是“大部分人在这种情况下会说什么”。我不否认我们都有“为了聊天而聊天”的时候,但这毕竟不是对话的主要功能。在绝大多数时候,我们的对话都是服务于某些特定目的。由于每个具体的对话在原则上都是独一无二的,往往要求对语言的创造性使用,包括在一定程度上突破字词的定义。如果你知道你的对话对象所说的永远是老生常谈,你得多无聊才要把这个对话进行下去啊。所以说即使现在的聊天程序确实有市场,它们也不代表对话的典型情境。

  

  真人与聊天机器人(绿色)的对话(截图来自网络)

  新理论该怎么为概念命名

  科学概念的定义和日常词语的定义相比又有更多的要求。尤其一个科学理论的核心概念需要严格和确定,并对整个理论的发展提供基础和导向。一个新理论往往是以若干新概念为标志的。为一个新概念命名时无非是两个办法,一个是造个新词,而另一个是改造一个老词。在两种情况下都需要用一个定义来界定这个词(以及其命名的概念)在这个理论中的意义。这两个办法各有麻烦:新词容易让人不知所云,而老词容易让人望文生义,所以为新概念挑个恰当的名字绝不是个容易的事。

  很多科学概念来自对日常词语的改造。这时一方面要基本忠实于这些词语的原意,但又要将其裁剪成满足理论要求的模样,所以不能完全迁就其日常用法。这种定义常被称为“工作定义”,以区别于字典定义。哲学家卡尔纳普在归纳逻辑的研究中试图给“概率”一个工作定义。他不是简单地陈述他的看法,而是先仔细地讨论了一个“元问题”:什么样的定义是个好定义?他提出了四条标准:

  1.相似性:新定义和该词语的日常意义接近;

  2.精确性:新定义能避免模棱两可的使用;

  3.有效性:新定义应为建立在其上的理论贡献成果;

  4.简单性:新定义要尽可能简单。

  这四条标准往往是会互相冲突的,比如说甲定义比乙定义简单,但没有后者精确。这时候就要综合平衡了。尽管如此,这组标准仍有相当大的普适指导性。如果一个工作定义在其中某一方面有重大缺陷,它在其它方面再理想也很难弥补其“短板”所造成的后果。

  定义AI是理论问题

  下面让我们以“人工智能”这个概念为例,分析一下工作定义中常见的问题。这里“人工”问题不大,公认就是指计算机及机器人这类人造器械,而“智能”就不这么好说了。这个概念自然是对人类精神能力的某种概括,但概括的程度或角度可能很不一样。

  首先,“智能”的工作定义仍需要保有该词汇字典定义的某些核心成分,否则不如换个别的词了。比如说如果把“智能”定义成“完美解决一切问题的能力”,那就连普通人都不够格了。这显然和这个词的一般用法的相似性太差,因为智能一直是被看作人的属性,而非神的属性。

  好的工作定义应当避免模棱两可的说法,从而为概念刻画一个相对清晰的边界。因为这个原因,用“认知”“思维”“意识”等概念来定义“智能”就不合适了,因为这些概念的边界并不比“智能”更清晰,尽管它们的意义和智能的确有相当大的重合。对一个概念的正确描述并不一定适合于被用作定义。

  “智能”的工作定义与其字典定义不是一回事,因为它不是要描写这个词目前的约定性用法,而是把它设定成一个研究目标。也就是说明你自己要创建的人工智能是什么样的,不管别人怎么看。所以一个好的工作定义的终极标准是在其基础上建立的理论所能达到的高度,尽管在开始时这个标准无法直接被使用。尽管如此,以此标准来剔除掉坏定义还是够用的。比如说目前有一种“泛智能”的看法,认为万物(至少所有计算机系统)均有智能,只是高低不同。这种看法能够自圆其说,但这样一来“人工智能”就成为“计算机科学技术”的同义词了,而没有多少新贡献。

  最后,科学家都喜欢简单概念,尽管理由不一。有人认为简单的更可能是正确的,有人觉得简单的更美,而有人认为简单的无非是更易用而已。这个话题这次不展开说。要提一下的是,有人断言智能不可能有一个简单定义,这就成问题了。和智能有关的现象的确看上去及其复杂,但这本身不能说明在其背后不可能找到一个相对简单的核心概念。其实在其他领域也是类似,而几乎每个科学理论都是在为看上去庞杂的现象提供简单、统一的解释的。

  关于人工智能的主要工作定义,我在《当你谈论人工智能时,到底在谈论什么?》里面有个简单综述,而我自己的观点在《人工智能:何为“智”?》里也已经介绍了。我这次要论证的是下列观点:

  “定义”是刻画语词及概念意义的重要方式,但不是唯一方式,也不总是最恰当的方式。这不仅仅是仅就人工智能而言。

  人们常常用“人工智能”这个“筐”装若干种不同类型的“货”。这样一个“字典定义”的确说明了这个词的当前用法,但在此基础上所得出的结论都常常只适用于其中某些工作,而完全不适用于另一些。

  对“智能”这个概念不存在唯一“天然正确”的定义,因为其意义是随历史时期、科学发展、应用领域、关注焦点等因素而变的。当然其中仍有相对稳定的成分。

  “智能”的一般用法(字典定义)和在一个研究项目中的用法(工作定义)不是一回事,尽管二者有联系。后者在很大程度上决定了其后工作的研究方向和范围,因此绝不简单是遣词造句的问题。

  没有一个公认的工作定义不说明人工智能不能成为科学研究的对象,而仅说明这个领域仍处在“独尊某术”之前的“百家争鸣”时期。

  目前对“人工智能”的不同工作定义是对一个复杂现象的不同抽象概括,各有价值。它们之间的关系是“见仁见智”,而非“谁对谁错”。由于其间的差别是根本性的,它们最终会演化成不同的研究领域。

  说不同的工作定义“都有价值”,并不是说它们都有相同的价值。这就好比是说登香山、泰山、黄山、珠峰“都有价值”一样。这要看你到底想要什么了。

  参考文献

  1. Pei Wang, What Do You Mean by "AI"? Proceedings of the First Conference on Artificial General Intelligence, pages 362-373, Memphis, March 2008

  2. Rudolf Carnap, Logical Foundations of Probability, University of Chicago Press, Chicago, 1950

  本文为严肃科普媒体《返朴》(微信号:fanpu2019)首发,《返朴》由国际一流科学家和科普专家担任总编及编委。任何媒体转载时须保留《返朴》名称及微信号和作者信息。未经许可,严禁对包括标题在内的任何改动。转载、授权、合作请联系fanpu2019@outlook.com

  

责任编辑:王超

科普中国APP 科普中国微信 科普中国微博
返朴
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢