智能的启蒙:通用人工智能与意识机器
作者简介
作者简介 刘志毅,人工智能科学家,上海市人工智能社会治理协同创新中心研究员,中国人工智能学会AI伦理工作委员会委员,上海交大计算法学与人工智能伦理研究中心执行主任,上海交大安泰AI与营销研究中心特聘研究员,上海开源技术信息协会AI伦理专委会主任。国际电工委员会IEC生物数字融合系统评估组(IEC/SMB/SEG12)伦理专家,国家人工智能标准总体组专家,AIIA联盟可信AI专家委员会委员,上海人工智能技术协会专家委员,主要研究领域包括人工智能伦理与治理、智能经济以及数字经济学等,个人学术专著包括《智能经济》《数字经济学》《AI与区块链智能》等,出版多部英文专著并翻译海外学者专著。 张少霆,博士,上海人工智能实验室智慧医疗中心主任及领军科学家,兼任上海交通大学清源研究院副院长。先后在浙江大学、上海交通大学、美国新泽西州立大学获得学士、硕士及博士学位。博士毕业后曾在美国北卡罗来纳大学计算机系任教至终身副教授。在学术界期间,曾获得美国橡树岭大学联合会青年教授奖、MICCAI青年科学家奖等,发表多篇封面论文及高引论文,文章他引15000余次,H-Index为60,并入选美国斯坦福大学发布的全球前2%顶尖科学家“终身科学影响力排行榜”。担任包括Medical Image Analysis在内的多个杂志的编委。在产业界期间,从智慧健康的研究、产品、商务到上下游布局,均进行着卓有成效的推进,并取得一系列落地成果,包括团队的软件著作50余项、全球专利近700件、国内外医疗器械认证20余项。
内容简介
序一(节选) 人工智能 vs 自然智能 ——智能时代的人工智能哲学与社会学思考 世界的意义必定在世界之外。 ——路德维希·维特根斯坦 进入 2023 年,中国出版界形成人工智能著作出版的热潮。刘志毅的《智能的启蒙:通用人工智能与意识机器》具有独特的框架和显著的深刻思想逻辑。全书分为四个部分。在第一部分,作者探讨了人工智能的起源和演变,强调通用人工智能和复杂系统的交融机制。在第二部分,作者提出因为人工智能而形成“科学的新地平线”,触及因果统计与通用人工智能的关系,描述了“图灵具身系统”,特别是量子力学对于人工智能的深层影响。在第三部分,作者思考了意识起源,以及对人工智能和人类大脑智能的比较和交汇,肯定了大模型的未来就是智能机器的“自我意识”。在第四部分,作者展现了通用人工智能的未来全景,阐述了如何实现“AI 与人类价值对齐”,以及通用人工智能的道德、数学与适应性。 在所有思想和文字的背后,是作者的如下信念:人工智能进入大模型阶段之后的根本特征是学习、推理和思维能力。作者对于人工智能的价值判断、人工智能技术趋势和未来的展望,以及所持有的立场倾向是积极和乐观的。为此,作者引入音乐语言和概念,例如“智能乐章”“AI 与人类价值对齐交响曲”“通用人工智能与大型语言模型犹如两件华丽的乐章,共同演奏人工智能的和谐之曲”,从而强化了一种隐喻的力量。 基于这本书所包含的丰富思想资源,特别是深层的哲学和社会学思考,我提出了四个基本问题,期望与作者和读者讨论。这并非通常的序言或者代序言模式。 一、人工智能、先验主义、维特根斯坦和数理逻辑 进入 20 世纪,人类正在以前所未有的加速度认知其所生存的地球、太阳系和宇宙。物理学家们提出量子力学、相对论,深入原子结构,解析基本粒子,直至发现和证明“夸克”的存在。原子半径在 10-10 米的数量级,而夸克半径则在 10-18 米的数量级。人类通过特定物理效应可以观测电子、质子和中子,却无法直接观测夸克。因为弦理论和 M 理论,人们开始接受宇宙是多维度的存在。与此同时,宇宙学家不断拓展关于宇宙的观测范围。根据最新的研究成果,人类所在宇宙的年龄在 137.7 亿—138.2 亿年,目前人类可观测的宇宙直径是 930 亿光年。 在这样的大背景下,传统的教育和学习已经不足以帮助人们理解和认知世界及宇宙。人类认知和真实世界之间的缺口,不是呈现缩小趋势,而是呈现扩大趋势。即使是知识阶层,也不可避免地深陷对于热力学第二定理的忧虑,不得不接受复杂科学框架、“哥德尔不完备性定理”的逻辑、“混沌理论”的描述,不得不相信世界的不确定性、对称性破缺、“增长的极限”和“科技奇点”,不得不面对大数据的超指数增长和信息爆炸。 正因为如此,我们必须寻求一种消除人类认知和真实世界之间的缺口的方法和力量。这种方法和力量当然不再是人本身,因为包括利用人类大脑在内的人的自身开发和潜力发掘,不再有很大的空间。人工智能的历史意义正在于此。唯有计算机和人工智能,才可以突破人类自身的智慧和能力已经逼近极限的现实。所以,人工智能是复杂世界体系和人类之间的桥梁,并非人类的简单工具。人工智能不是弥补人类能力之不足,而是解决人类没有能力意识到并提出的问题,超越人类智能和经验。 事实上,人工智能是一种“先验”,或者“超验”(transcendent)的存在。因为人工智能的原理是先于人类的感觉经验和社会实践 的。1950 年, 艾 伦· 麦 席 森· 图 灵(Alan Mathison Turing,1912—1954)提出机器是否可以思考的问题,并且给予肯定的回答与论述,这与其说是一种“预见”,不如说是证明的人工智能的先验存在特征。在 1950 年那个时间节点,人工智能还存在于现实世界之外,存在于那个超越经验、超越时空的理念世界之中。图灵的人工智能想象和思考,原本存在于他的理念世界之中,只是在特定环境之下得以被激活。其实,不只人工智能,计算机的历史,至少从帕斯卡(Blaise Pascal,1623—1662)到巴贝奇(Charles Babbage,1792—1871)的探索,也是先验主义(transcendentalism)的证明。 自 1956 年关于人工智能的达特茅斯会议之后,人工智能开始了依据自身逻辑的演进过程。今天,当我们回顾和审视过去的 67 年历史,不难发现:人工智能的真实演进路线是最为完美的,没有走过真正的弯路,而且每个阶段之间都存在必要的间歇和过渡。这是任何人工智能的人为设计路线都无法做到的。例如达特茅斯会议所形成的三条路线,不是对立关系,而是补充关系,现在的先后顺序是最合理的选择,因为人工智能的联结主义路线需要以符号主义作为前提和开端。机器学习优先于深度学习也是同理,使得人工智能技术完成从通过机器算法的学习到通过神经网络的学习的进步。至于人工智能生成内容、ChatGTP、从transformer 到大模型,都是人工智能发展过程的瓜熟蒂落和水到渠成而已。人工智能原本就有一张路线图,而人工智能历史是展现这张路线图的过程。 特别值得思考的是大语言模型(Large Language Model,简称 LLM)。简言之,大语言模型是一种能够生成自然语言文本的人工智能模型。自 2022 年末,OpenAI 公司的 GPT(Generative Pre-trained Transformer)系列大模型因为可以广泛应用于自然语言生成、语音识别和智能服务等领域,成为人工智能历史的重大分水岭。GPT 的重要优势是采用了 transformer 架构,即一种基于注意力机制(Attention Mechanism)的神经网络结构,可以支持模型高质量处理长文本,把握文本中的长期依赖关系。更为重要的是,GPT 的预训练基于无监督学习方式,通过在大规模文本语料库中学习语言的统计规律和模式,理解和生成自然语言文本。此外,GPT 所构建的多层次、多粒度的语言模型,其每个层次都对应着不同的语言表示方式,可以逐渐深入理解和生成更加复杂的自然语言文本,包括上下文信息,句子和段落的结构、主题,以及词汇、语法、句法、语义,最终适应不同的自然语言处理任务。 大语言模型在自然语言处理领域的成功应用,完全符合人类智能结构,在很大程度上扩展和实践了维特根斯坦(Ludwig Josef Johann Wittgenstein,1889—1951)的理论。在维特根斯坦看来,语言的边界就是思维的边界。“语言必须伸展得与我们的思想一样遥远。因而,它必须不仅能够描述实际的事实,而且同样能描述可能的事实。”所以,语言的本质在于它的使用方式。语言的真实性与其在实际使用中的效用相关联,而不是通过符号与客观世界之间的对应来获得的。图灵在维特根斯坦过世前一年已经提出关于人工智能的核心思想,维特根斯坦是否注意到不得而知。可以肯定的是,实现人工智能和自然智能的交流和融合,将传统的人—人交流模式转变为人—机—人交流模式。 这样的改变意义巨大。人类已经堕入自然语言的危机之中,因为歧义的蔓延使得交流成本扩大。现在看,大语言模型是拯救人类、摆脱危机的重要途径。 进一步思考,我们可以发现在大语言模型与数理逻辑(或称人工智能的“符号主义”流派)之间存在某种关联性。数理逻辑又称“符号逻辑”,核心特征是用抽象的符号表示思维和推理,实现证明和计算结合,构建形式化的逻辑关系。莱布尼茨(Gottfried Wilhelm Leibniz,1646—1716) 是 数 理 逻 辑 的 开 山 鼻 祖, 罗 素(Bertrand Arthur William Russell,1872—1970)是数理逻辑的集大成者。大语言模型在很大程度上逾越了数理逻辑的各种技术性障碍,因为大语言模型具有莱布尼茨和罗素所难以想象的十亿、百亿、千亿,甚至上万亿的参数,以及海量的大数据和语料库,通过对大数据的分类和训练,大语言模型可以实现数学方法、计算机算力和程序语言的结合。大语言模型将很可能是数理逻辑研究的未来形态,或者数理逻辑研究因为大语言模型获得全新的生命力。 如今,人工智能真正的特殊之处是,人工智能已成为推动人工智能发展的动力。也就是说,人工智能推动人工智能成为更为先进的人工智能,走向通用人工智能(Artificial General Intelligence,简称 AGI), 进 而 通 用 人 工 智 能 和 通 用 技 术(General Purpose Technologies,简称 GPTs)发生时刻的重合。人类进入包括数学、物理学、化学、生物学和宇宙学在内的科学研究日益依赖人工智能的时代。我们已经无法想象没有人工智能参与和支持的科学实验和科学研究。我们更要看到的是,人工智能和科学形成互动关系。人工智能和科学的融合,将强化人工智能的深层科学属性,使得人工智能的实际张力超出人们就人工智能认识人工智能的限制。 朱嘉明 2023 年8月1日于北京 ChatGPT及AIGC技术爆火背后,代表着AI大模型进入一个新的技术范式,大模型是一个快速发展、快速引爆市场的机会型技术,将会带来新一波创业热潮,无论是我们今天已经看到的应用,还是未来会看到的应用,都将会有非常大的潜力。这本书不仅是一部关于通用人工智能发展的科普作品,更是一部兼具教育和启蒙作用的著作。它在深入浅出地讲解复杂的技术理论的同时,引领读者进行深度思考,揭示人工智能如何改变我们生活和思考方式的真问题。本书不仅关注人工智能的技术和应用,更重视人工智能的伦理和价值。作者从通用人工智能的角度,跨越学科边界,涵盖神经科学、哲学、语言学、数学等多个领域,深入浅出地揭示了通用人工智能的全貌。此外,本书对人工智能与人类价值的对齐问题,以及人工智能在伦理、道德层面的讨论,都对我们理解和接受人工智能的发展起到了至关重要的作用。