识别算法与人脑区别的语言学视角
识别算法与人脑区别的语言学视角 数字文明的勃兴,使法学研究俨然走进了一个“开篇不谈数字法,读尽法学也枉然”的时代。的确,这是人类继工业文明后,正在发生的又一次千年未有之大变局,涉及个人的隐私、信息等以超出个人意欲控制的方式暴露于网络空间,各主体层面上的数据安全形势空前严峻,新的风险社会因此使人有手足无措之惑。 面对数字3.0时代大数据的指数级增长,算法和算力的日益扩张,以致很多数字领域的精英几乎一致主张的人工智能终将战胜人脑的网络空间治理,法律人理当何为,对数字法从何谈起,无疑成为一种近乎叩击灵魂的拷问,要求“全世界法律人,联合起来”并非虚言!因此,分析算法的原理,厘清人工智能与人脑的关系,是研究数字法学者理应担当的学术使命。 倪梁康教授曾在“人工智能与神经科学时代的意识哲学研究”讲座中,进行了富有启发的分析,即从意识的角度看,可以将既有的有关意识的研究分为三个分支,分别是作为神经科学、脑科学研究对象的“自然生物意义上的意识(准quasi意识)”(脑机接口的原理即本乎此——笔者注),作为哲学和精神科学(注意:不是神经科学)研究对象的“个体意识即主观内心世界(纯pure意识,意识本体)”,以及作为人工智能研究对象的“第三世界的信息(类like意识)”。后二者正好可以揭示当下人工智能和人脑的关系。问题的焦点在于,首先是作为人脑功能即作为一种本体的意识亦即纯意识无法定义。可以借用萨瑟兰(Stuart Sutherland)在为《麦克米兰心理学词典》撰写的词条中的一段作为说明:“意识,有知觉、思想和情感;觉知。除非使用一个更难理解的、没有把握住意识含义的术语给意识下定义,否则意识是不可定义的。 意识是一种令人着迷但又难以捉摸的现象:不可能具体说明它是什么,能做什么,或者为什么会进化出意识。还没有任何值得一读的有关意识的作品。”其次是作为人工智能的这种类意识只是一种信息处理机制。如Stuart Russell(斯图亚特·罗素在其新著Human Compatible所言:人工智能中没有人在使机器有意识,也没有人知道从哪里开始,也没有行为将意识当作先决条件。……所有那些好莱坞关于机器神秘地变得有意识和憎恨人类的情节真的错过了这个要点:重要的是能力,而不是意识。更有甚者,因为人工智能作为信息处理机制所带来的便捷,可能还会产生一些负效应。 其实,抛开神经科学关于意识的研究,就人工智能(类意识)与人脑(本体意识)之间的关系而言,仍然可以找到化约二者的要素,并由此可以澄清二者的区别。这就是作为二者最终表现形式的语言,虽然前者是一种人工语言,而后者必须也只能通过人类的自然语言呈现自身。也正是在这里,我们可以更加清晰地看到二者之间的鸿沟。因为,作为人工智能基础的算法所依赖的计算理性是一种数理逻辑。并且,就其实质而言,算法所使用的语言实际上是一种以0和1这两个数码为单位的二进制人工语言,无论人工智能将来进入到高阶的何种阶段,如自主学习和自动数据处理的更加智能化,其最终的原理都将还原为这种可以符号化的二进制人工语言,这与人脑在思维时融合了感觉、知觉、情感等理性和非理性因素而形成的包含多重复杂因素而形成的自然语言有着本质的不同,后者因其自身蕴含的丰富性无法被简单还原为二进制的计算机语言。 申言之,辨识二者的差异有多种方法,其中,从语言哲学自身演进的历程反思语言的属性并理解语言的意旨,以此观照人工语言,探究人工智能的属性,应该是更为根本的方法。 由于语言哲学研究本身的淹博,还由于国外语言哲学研究天然的语言上的障碍——跨文化的译不准和不可通约性,我倾向于将汉语世界有关语言哲学的研究著述作为敲门砖,虽然更精深的理解把握还须回到经典的语言哲学著述。盛晓明教授的这本《话语规则与知识基础:语用学维度》是我最愿推荐的。 盛氏此书直接从语用学维度切入对语言哲学史的梳理,扬弃在此之前的语义学意义上的语言哲学,乃是基于这样的信念,即“后期维特根斯坦和言语行为论为当今哲学的走向构筑了一种新的平台”(以下如无特别标明,引文均摘自该书),以致自托马斯·库恩以来,即使“科学逻辑为科学语用学所取代已成为不可逆转的趋势”。作者继续分析认为:在此之前,延续了近半个世纪的“语言学转向”尽管不能说一事无成,但却犯了方向(即如前期维特根斯坦的关于世界的图像论)性错误,结果是非但没能摆脱形而上学的幻想,反而使自己陷入语法的幻想。因此,必须立足语用学视野,“把语言、知识和科学放到人类生活实践的语境中来考察,并把它们都看成是一个pragma的问题,”而“不可能像在句法——语义维度中那样,只接受一系列经意义澄清后确凿无疑的概念。” 作为一种学术史梳理,该书依照语用学的发展形态依次介绍了语用学的几种理论——维特根斯坦的语言游戏说、奥斯丁的言语行为理论、哈贝马斯的普遍语用学方案、阿佩尔的先验语用学以及科学知识的社会建构等,以凝练的笔触,入繁出简,完成了对语用学诸种主张的一次巡礼,证立了基于语用学立场的语义理解路径,即(自然)语言意义的把握植基于言语主体的主体间性及由此形成的语境,其含义没有确定性,只有一种社会共识,主张在各参与主体之间的对话、体验中实现可接受性。这或可视为对追求概念含义确定性的语义哲学的致命一击。 回到这里讨论的主题,可以确证的是,自然语言意义的丰富性自始就无法符号化,意识即自然语言的自在性只能让我们接受维特根斯坦的那句名言:凡不能说的,就应该保持沉默。所谓的人工智能只是一种拟人化说法,其工作原理实际是一种符号化的信息处理机制,不是也不可能是自然语言的运用,人工智能与人脑只能永远在“迥途”。而基于语言分析的视角对根植于数理逻辑的算法进行的祛魅,是对算法即人工智能具有人的意识断言的根本性解构,经此可以认识到二者的本质区别,也可以克服算法理性的僭妄。这里还要说明的是诸如性别、民族等的算法歧视问题。实际上,这种歧视并非源于人工智能的“意志力”,而是在向算法提供的数据中,因人类自然语言中已经包含的某种价值判断使然(李成,2021)。 在法律语言学研究者看来,法的世界肇始于语言,法律语言与概念的运用,法律文本与事相关系的描述与诠释,立法者与司法者基于法律文本的相互沟通,法律语境的判断,等等,都离不开语言的分析。因而,德国法学家考夫曼断言,法学其实不过是一门法律语言学。此说昭示了法律在向古典时代即古希腊罗马时期作为法律本来样态的法律修辞学的某种回归。 经历了对近代以来因为科学主义的倡行,以致知识的对象化和确定性成为一种信念之后的辩证反思,法律修辞学重新赢得了自己在法律论证中的应然地位,以辩证逻辑的方式,有效弥合了三段论的演绎推理的不足。毕竟,“只要是有公开论辩过程的地方,就会有修辞的存在(Neil Macmick,2005)”。这实际是以法律语言特有的方式,回应了整个哲学的语言学转向。明乎此,在对数字法学的研习中,从自然语言的语用学立场出发,可以了解自然语言的奥义,并以此区分人工语言与自然语言。这将有助于摒弃在对人工智能认知中的唯科学主义信念,正视人工智能与人脑之间的差异,视其为理解和研究数字法学的不二法门,或许并不为过。 7