据《自然》杂志报道,意大利科学家正在开展一项名为“维苏威火山挑战”(Vesuvius Challenge)的研究,该研究旨在通过人工智能解读过去无法解读的古代文献,例如因火山爆发被烧毁的莎草纸卷轴、破碎的楔形文字泥板等。多国的研究团队正在进行类似的尝试。
阅读古文字。图片来源:《自然》杂志引自慕尼黑大学。
“维苏威火山挑战”的项目名称来源于公元79年维苏威火山的爆发,许多珍贵的莎草纸文献在火山喷发中遭到损毁。18世纪,研究人员从意大利庞贝附近赫库兰尼姆的一座罗马别墅遗迹中发掘出数以百计的卷轴。这些卷轴写有文字的部分多已炭化,使得研究人员很难进行解读。
科学家们一直致力于用新的科技辅助解读这些古老的文献。美国肯塔基大学的计算机科学家布伦特·西尔斯(Brent Seales)就曾花费数年时间开发“虚拟展开”(virtual unwrapping)技术,即通过对古卷的内部结构进行高分辨率扫描,再绘制横截面,最后用算法将其展开为平面图像。2015年,这种技术成功解读了以色列恩戈地的一个可追溯至公元三世纪的烧焦古卷。
恩戈地古卷写作的墨水中含有铁,在计算机扫描的过程中会发出光芒。与之不同的是,赫库兰尼姆古卷的抄写员使用的是碳基墨水,在计算机扫描中几乎不可见。解读难度的增大迫使科学家团队思考新的探索方案。西尔斯认为,即使无法直接看到墨水,他们或许可以通过训练神经网络发现裸露的莎草纸和写有墨水的莎草纸表面纹理的差异,进而推进解读。
“维苏威火山挑战”在这种需求下应运而生。西尔斯的团队于2023年3月和硅谷企业家纳特·弗里德曼(Nat Friedman)合作,发起该挑战赛,他们公布了卷轴表面的扁平图像,要求参赛团队通过训练神经网络来寻找差异,以赢取丰厚的奖金。最终,超过1000个团队参与比赛。今年2月,一支由多位计算机专业学生组成的团队获得奖金。该团队鉴定文本可能来自于伊壁鸠鲁派哲学家菲洛德摩斯。
多名学者认为,近些年来,人工智能的高速发展正在大幅重塑我们对古代世界的看法。早在2010年,人们就已经开始将深度学习应用于古代文献的研究中。人工智能也逐渐表现出与人类考古研究者协作的潜力。英国诺丁汉大学的西娅·索莫斯奇尔德(Thea Sommerschield)等人曾经使用公元前七世纪至公元五世纪之间的数万个希腊铭文训练了一个名为Pythia的模型,通过大量数据的训练,向模型展示它从未见过的文本时,它可以根据上下文重建文献中缺失的字符。2022年,他们对模型进行了升级,以使其能捕捉到更复杂的语言模式。索莫斯奇尔德表示,在测试中,面对人为制造的古代文本空白,人工智能的修复准确率达到62%,高于人类研究者的25%。不过,若人类研究者在人工智能的帮助下开展研究,修复准确率可以上升到72%。
人工智能正在展现出的潜力已经为多个国家所重视。中国的多个研究团队都曾尝试借用人工智能的力量破译甲骨文。今年年底,在接受媒体采访时,厦门大学信息学院自然语言处理实验室史晓东团队就曾表示,团队正在利用已经破译出的1000多个甲骨文,通过人工将其拆解为IDS(表达结构的部首偏旁序列)。找出与现代文字IDS的对应关系后,再将这些数据“喂”给AI,实现学习。
西尔斯将这些有待科技进一步挖掘的文献称作“隐形图书馆”,包括中世纪书籍、古埃及木乃伊包裹物中的文本等等。“如今,人工智能帮助我们打开了曾经无力访问的资源。”
参考链接:
1.How AI is unlocking ancient texts — and could rewrite history
https://www.nature.com/articles/d41586-024-04161-z
2.“唤醒”甲骨文 厦大团队尝试用AI破译古老文字
https://news.xmnn.cn/xmxw/202412/t20241211_286795.html
本文为编译内容。编译:刘亚光;编辑:西西;校对:穆祥桐。欢迎转发至朋友圈。文末含《新京报·书评周刊》2023合订本广告。
点击“阅读原文”
打开2024新京报年度阅读推荐入围书单~