■胡翌霖
4月23日迎来今年的世界读书日。
人类早就不可能通览世间一切书籍了,但人工智能(AI)可以做到。信息时代,电子版书籍不再需要宏伟的书架,一部普通的智能手机就足以存储几座图书馆的书籍,让“搜集世间一切书籍”的宏愿得以实现。AI的到来,又让越来越细分的专门领域的知识可以被通览、被综述。
AI能读世间一切书籍了,人类还需要读书吗?
“搜集世间一切书籍”:从可能到不可能,再到可能
大约公元前295年,托勒密一世委托希腊学者德米特里乌斯在亚历山大城兴建宏伟的图书馆和缪斯宫(学术机构)。德米特里乌斯提出了“搜集世间一切书籍”的宏大构想,并得到王室的持续支持。前三世托勒密王不断扩大这一工程,并且持续了150年。为了搜集书籍,他们手段尽出,一方面斥巨资派遣专人去世界各地“淘书”,另一方面强令停靠港口的船只交出随船携带的所有书籍,由抄写员抄录后送还副本,把原本纳入收藏。
这些书籍促成了希腊科学的集大成,促成了古代科学的无数璀璨成就。可惜和任何古代文明的黄金时代一样,随着战乱、政权更迭和宗教冲突,无数图书最终散佚,只有少数顶尖的成就得以流传后世。托勒密三世时期达到鼎盛的古代西方学术经历了一轮轮衰落和复兴。
16世纪,瑞士学者康拉德·格斯纳致力于编纂第一部综合性的《书目大全》,试图罗列谷登堡印刷术百年之内出版的一切拉丁语、希腊语和希伯来语著作。
由印刷书和邮政网络组成的跨国学术交流圈取代了原本局限于一时一地的学术圣地,珍贵的文本也不再依赖固定场所来保存,人们不再害怕因为传抄困难而造成的书籍散佚和讹误,即便是非主流的学说也可能流传于世。
再之后,现代早期的百花齐放在牛顿那里完成了一次综合。牛顿死后,欧洲进入了启蒙时代,百科全书派是这个时代的代表。他们继续整合已有著作,汇聚和整理印刷时代以来人类所积累的一切知识。
启蒙时代之后,学术进入了专业化时代,配合现代教育制度的逐渐成熟,科学成为“分科之学”。学者们在越来越细分的专门领域探索,顶多在某一学科之内汇聚和整理,再也难以把人类的一切知识统一在一起了。
“搜集世间一切书籍”的宏愿过时了吗?在手抄书时代,托勒密王做到了极致;在印刷书时代,格斯纳空前绝后;在信息时代,这一宏愿又有了新的形式。
电子版书籍不再需要宏伟的书架,一部普通的智能手机就足以存储5座亚历山大图书馆的书。这使得“搜集世间一切书籍”重新成为可能。
1996年建立互联网档案馆的布鲁斯特·卡尔直接致敬亚历山大图书馆,甚至号称自己做的就是“亚历山大图书馆2.0”。
几年后,谷歌图书启动了“搜集世间一切书籍”计划,并在2010年估算出世间所有语言的已出版图书大约有1.3亿种,并宣称要把它们全部扫描成电子版。
不过,它们的雄心都遭遇了挫折,陷入了漫长的版权诉讼。为了突破版权制约,一些人转向了海盗平台。Annas Archive成为海盗平台的集大成者,搜集数千万书籍和上亿论文,供所有人免费下载;启动了“搜集世间一切书籍”的计划,试图搜罗7亿册图书。
“选书”的责任落在人类身上
无论是互联网档案馆的合作模式还是海盗模式,人类确实在数字世界打造了新的亚历山大图书馆,并且初见成效。那么接下来的问题是这些书要怎么读。互联网帮助人们把海量的书籍搜集起来,但是互联网也正在降低人类的阅读能力。特别是互联网时代成长起来的年轻人,花在短视频上的时间远远超过阅读,即便是阅读文字,也越来越倾向于短篇消息,而不是整部书籍。而学者们的阅读内容越来越偏重论文,而非著作。
人类早就不可能通览世界一切书籍了,但AI可以做到。数字化的书籍不但能被集中起来,而且可以被通览、被综述。AI在许多方面已经表现得比顶尖的学者还厉害,特别是旁征博引驾驭海量文献的能力,以及进行跨专业、跨学科综合的能力。
不过,AI一方面使人类文明沉淀下来的无数书籍发挥了作用,另一方面似乎正在进一步削弱人类阅读的需求,甚至连传统的学校教育都变得无关紧要了。正如有了计算器,心算能力就没用了;有了手机地图,认路能力就没用了;而有了随时能对任何问题作出精妙回答的AI,人类整个大脑的用处也要大打折扣了。
笔者对AI发展是颇为乐观的,愿意相信AI会颠覆整个学术和教育体系,打破专业壁垒,把人类知识推向新的盛世。
自文艺复兴以来500年,人类已经习惯了持续进步,但为什么能够持续进步呢?在某种意义上,一个最简单的理由就是书籍不再容易散佚了。印刷术结合开放的市场环境,使得人类的知识不断积累,后人永远可以站在前人的肩膀上继续推进。
这种局面在印刷书被数据库取代后还能继续吗?我们看到,初代AI确实能够站在全人类的肩膀上集知识之大成,但是由AI创造出来的新信息仍然能够构成下一代AI的“肩膀”吗?
对此,学界已有许多研究,证实了所谓“模型崩塌(Model Collapse)”现象,就是说不加人工筛选地使用模型生成的内容来训练AI,反而会让模型变坏,趋于平庸化,加剧幻觉。即便数据集中只是混杂了很小一部分AI自己生成的样本,也会让训练效果变糟。要让模型不断进步,就必须引入人类的判断力,即不断输入人类创造的信息,以及经过人类筛选和组织的AI生成信息。
随着AI能力的进一步提升,这一现象会消失吗?也就是说,AI能够脱离人类自己训练自己而不断提升吗?在笔者看来,至少在可预见的未来这是不可能的,因为AI缺乏人类的个体性和有限性。人类的思维被局限于一个个独立的身体之内,有生老病死,有个体边界,因而更容易发展出差异化的兴趣和追求。而AI没有个体的欲望,只能根据大数据的公约数来确定追求的方向,因此它有集大成的能力,但缺乏另辟蹊径和别出心裁的动机。
所以,在生产力方面,人类大可以让AI取代自己,但不能放弃欣赏者和评选者的角色。AI也许比人类更善于“读书” ,但“选书”的责任仍然落在人类身上。
在AI时代,人类仍然需要读书,不是为了掉书袋或生产力,而是为了保持和培养兴趣与品味,从而能够引导AI读哪些书。
<!-- 非定向300*250按钮 17/09 wenjing begin -->
<!-- 非定向300*250按钮 end -->
</div>