维苏威火山挑战:用人工智能破译赫库兰尼姆古卷——2000年的沉默再次说话

被火山烧成木炭的卷轴,在未打开的情况下开始显露出内容。这种科幻般的事件如今已成为现实。关键是可以让隐形墨水出现的人工智能,以及可以以原子级精度透视物体的巨大实验装置。您无需翻页,而是在计算机内“展开”卷轴。最后出现的是两千多年前一位哲学家写下的文字,此前从未有人读过。古老技术与尖端技术的交叉点现在正在发生什么?让我们一步一步来看看。


2026 年 6 月 25 日,维苏威火山挑战赛宣布破译了赫库兰尼姆古卷的新文本、标题和作者。这一发现是利用 ESRF(欧洲同步辐射设施)和英国钻石光源的高分辨率微型 CT 扫描得出的。在PHerc。 1667年,位于那不勒斯的约1.5米的连续文字和约20根柱子(官方约为22根柱子)被虚拟打开。

当卷轴在 20 世纪 80 年代被部分打开时,人们发现它难以辨认,被认为是公元前 2 世纪或公元前 3 世纪后期。联合创始人、肯塔基大学教授布伦特·希尔兹和那不勒斯费德里科二世大学助理教授费德里卡·尼古拉迪进行了这项分析。来自PHerc。 139,《菲洛德莫斯论众神,第 8 卷》的标题被确定。扫描是在 ESRF 的 Extremely Brilliant Source 和光束线 BM18 上进行的,每卷可生成高达 300 TB 的数据。还剩下 600 多卷未打开的卷轴。

从: 赫库兰尼姆古卷再次开始说话的那一天

【编辑部评论】

首先我们来梳理一下这条新闻的“主角”。该项目被宣布为一个名为“维苏威挑战”的国际项目。这是一项有现金奖励的开放技术竞赛,由 GitHub 前首席执行官 Nat Friedman、企业家 Daniel Gross 和肯塔基大学的 Brent Shields 于 2023 年 3 月发起。其目的是吸引世界各地的大脑参与“阅读赫库兰尼姆古卷的挑战,这些古卷由于火山的高温而碳化,如果不亲自打开它们就无法打开。”

这里发生的事情的本质不仅仅是考古发现。“图像处理和人工智能的胜利”是。由于卷轴上的墨水和纸(纸莎草)都是由相同的碳制成的,因此即使用 X 射线拍照,通常也看不到字迹。参赛者训练了一个神经网络,根据纸莎草表面纹理的细微差异来确定“这里有墨水”。 ESRF 和 Diamond Light Source 等同步加速器设施负责拍摄,将卷轴转换成每个高达 300 TB 的海量三维数据。它具有两阶段结构,其中“虚拟展开”(实际上展开卷)和人工智能分析应用于这些原始数据。

本演示文稿中需要记住的要点是:结果比 ESRF 版本传达的范围更广泛。这就是重点。据肯塔基大学和Diamond Light Source发布的公告,除了PHerc还有20根长约1.5米的柱子。 1667 年,从 PHerc 中恢复了 70 多列文本。 172,牛津博德利图书馆藏,已被确定为菲洛莫斯《论恶习》的第一卷。 ESRF 文章没有提到这个 PHerc。 172,因此您需要对多个源进行分层才能获得完整的情况。innovaTopia之所以现在拿起这份报告,是因为这是一个转折点,标志着从“单一破译”到“全面解读多卷”的转变。

分层酱的价值还体现在卷轴本身的内容上。而ESRF版本仅标识了PHerc的作者。 1667 年被称为“未知”,Diamond Light Source 的声明更进一步指出它可能与斯多葛派哲学家 Chrysippus 的作品有关,该作品仅存碎片。一方谨慎地保留观点,而另一方则将其作为假设提出。即使结果相同,但不同设施的分辨率不同,这就是阅读和比较原始信息的意义所在。

你不能错过的是希尔兹在文章后半部分所说的话。“转折点在于目的,而不是技术。”这是一句话。 2023年的第一次破译仅能读取某卷轴的大约5%。然而,人类现在无法跟上人工智能吐出文本的速度。换句话说,主导角色开始从设计工具的工程师转向解读希腊语并将其置于语境中的古典学者和纸莎草学者。随着技术的成熟,价值的来源从“移动”转向“赋予意义”。——这可以说是一个适用于AI时代很多领域的结构。

赫库兰尼姆并不是这项技术开放的唯一地方。虚拟展开可以应用于您想要在不破坏其内容的情况下阅读其内容的任何对象,例如旧书装订中重复使用的另一个文档或由回收纸莎草制成的木乃伊面具。被认为已经失传的古代作品可以在不进行物理接触的情况下将一件又一件地归还给人类知识。——最大的意义在于兼容文化遗产的保存和解读。

另一方面,让我们冷静地看待潜在的问题。 AI基于有墨水的假设所绘制的字符只是概率重建。如果没有人工编辑,仍然存在创建不存在的读数的风险。这就是为什么该团队建立了一个系统,其中每个读数都由纸莎草学者一一验证。在处理古老的思想时,可以说这是一个验证的严格性比速度更重要的领域。

从长远来看,重要的是还剩下 600 多卷未打开的卷轴(有消息称这个数字约为 800 卷,但这是因为“未打开的数量”和“纸莎草总数”的参数计算方式不同;无论如何,事实仍然是大量未打开的卷轴)。如果把这些都读完,古希腊罗马世界的思想史甚至有可能被部分改写。此次确定的《诸神论》第八卷,彻底改变了此前仅从第一卷得知的作品整体面貌,其连锁反应是不可估量的。我们正站在 2000 年来沉默的声音将以何种顺序讲述的门槛上。

赫库兰尼姆古卷
公元 79 年维苏威火山喷发期间碳化的古代卷轴收藏,以及附近城市赫库兰尼姆一座豪宅的图书馆。虽然已化为一坨木炭,但据说是古代世界仅存的唯一完整的书籍集,学术价值极高。

虚拟展开
该技术允许使用从 X 射线 CT 扫描获得的三维数据“虚拟展开”易碎的卷轴,而无需物理打开它们,并将其展开为可读取的单张平板。它最大的特点是可以读取物体内部而不破坏它们。

显微CT扫描
一种以比医学 CT 更高的分辨率对物体进行成像的方法。纸莎草纸比人的头发还细,因此需要对每一层纸莎草纸进行识别,其精度是普通设备无法达到的。

同步加速器(同步加速器辐射设施)
一个大型研究设施,可将电子加速到接近光速,并利用在此过程中产生的极其明亮的 X 射线。它可以像巨型显微镜一样可视化材料的内部结构。这包括 ESRF 和钻石光源。

极光源(EBS)/ BM18
EBS是ESRF推出的下一代高强度同步辐射源。 BM18 是一款旗舰光束线(实验站),它利用了这一功能,并能够使用精细且稳定的光束重建高质量的断层图像。

神经网络/机器学习
为了解决由碳制成的墨水几乎完全被埋在同样由碳制成的纸莎草中的问题,采用人工智能方法根据表面纹理的差异来估计墨水的存在或不存在。它在使字符从扫描数据中出现方面发挥着核心作用。

菲洛德摩斯(加达拉的菲洛德摩斯)
活跃于公元前一世纪左右的希腊伊壁鸠鲁哲学家。他被认为是一位住在赫库兰尼姆宅邸的哲学家,他的著作解释了迄今为止破译的许多古卷。这一次,《关于诸神》第八卷的存在已经被确认了。

狮子(克里西波斯)
公元前3世纪斯多葛学派的代表哲学家。据说他留下了大量作品,但如今仅存碎片。钻石光源指出PHerc。 1667年可能与克里西波斯的这部作品有关。

斯多葛主义/伊壁鸠鲁
两者都是古希腊和罗马哲学流派。 PHerc。 1667年被视为反映斯多葛思想的伦理学专着,出现了horme(冲动)和phronesis(实践智慧)等概念。另一方面,菲洛摩斯属于伊壁鸠鲁学派。

纸莎草纸(纸莎草学)
破译古代纸莎草文献并检查其日期、作者和内容的学术领域。人工智能提取字符后,负责验证其阅读并将其置于上下文中。

PHerc。 1667/139/172/26)
“Papyri Herculanenses”的缩写,赫库兰纸莎草纸的参考编号。每个数字代表一个单独的卷轴,例如那不勒斯的 1667 和牛津大学博德利图书馆的 172。

[参考链接]

维苏威火山挑战赛(官方网站)(外部)
使用人工智能、计算机视觉和几何学破译碳化卷轴的有奖竞赛的官方网站。公布数据和参与方式。

ESRF(欧洲同步辐射设施)(外部)
世界上最亮的同步加速器设施位于法国格勒诺布尔。我负责在BM18光束线上拍照。

钻石光源(外部)
英国同步加速器设施。拍摄PHerc。 172 并进行了扫描,识别出《On Vice》第一卷。

肯塔基大学赫库兰尼姆分校特别页面(外部)
领导该项目的肯塔基大学的特别页面。它提供演示摘要、媒体工具包和视频材料。

那不勒斯国家图书馆(Biblioteca Nazionale di Napoli)(外部)
那不勒斯国家图书馆藏有赫库兰尼姆纸莎草纸。一个合作组织,也是本次颁奖典礼的场地。

[参考文章]

历史性突破:从碳化赫库兰尼姆古卷中恢复古代作品(Newswise)(外部)
肯塔基大学官方宣布。我们报告了 PHerc 1.5 米和 20 步的恢复情况。 1667 和 PHerc 的 70 多个步骤。 172、新作品鉴定。

赫库兰尼姆古卷揭示的新秘密(钻石光源)(外部)
负责拍摄的戴蒙德宣布。确认《论罪恶》、《论诸神》8卷组曲、以及与克里西波斯有关的理论。

第一次阅读完整的赫库兰尼姆古卷(维苏威火山挑战公式)(外部)
他解释说,这是 PHerc 现有部分首次出现。 《1667》没有打开,就从头到尾完整地读完了。表示拍摄、重建、机器学习的过程以及数据将在哪里发布。

维苏威火山挑战赛2023大奖颁发:我们可以阅读卷轴!(维苏威火山挑战赛公式)(外部)
记录了2023年70万美元的大奖是如何颁发的。记录了作为实现这一结果的起点的时代。

三名学生刚刚破译了 2000 年前古卷的第一段(史密森尼杂志)(外部)
据报道,截至 2023 年,每本书约有 5% 被破译,总奖金超过 100 万美元,这证实了迄今为止所取得的巨大飞跃。

科学家刚刚解开了维苏威火山焚烧的古代卷轴的秘密(华盛顿邮报)(外部)
从一家主要综合报纸的角度来报道这一公告。解释了破译约 20 个台阶的难度,以及碳化卷轴一触即碎的难度。

[相关文章]

AI技术成功解读古罗马烧焦的纸莎草:历史新曙光
一篇文章告诉你维苏威挑战赛在 2024 年已经到达了哪个阶段,他们成功破译了第一卷轴并获得了 70 万美元的大奖。这是这个结果的起点。

AI破译古罗马卷轴,为历史研究带来新面貌
一篇文章报道了人工智能破译赫库兰尼姆古卷的阶段,以及恢复丢失的哲学对话的可能性开始显现。您可以通过阅读这篇文章来了解进展情况。

[编者后记]

我认为这个故事之所以有趣,是因为最先进的人工智能不是走向“未来”,而是走向“过去”。我们经常希望人工智能能够预测明天的天气或明年的市场,但在这里,这种力量被注入了 2000 年前的沉默中。用于前进的工具用于回顾。这张照片有一些新的东西,我一时间无法将它从我的脑海中抹去。

我多次关注过这个项目的进展。你们中的一些人可能还记得,在 2024 年,当第一卷只有百分之几的人阅读时,人们很兴奋,因为它改变了游戏规则。两年过去了,我现在已经可以完整地阅读每一卷,并确定标题和作者。我认为能够花时间观察一项技术从令人惊讶的发现发展成为日常方法是很有价值的。

另一件让我印象深刻的事情是,一旦技术达到最后阶段,主导角色就会被取代。让这些字母出现是工程师的工作,但当需要破译它们的含义时,接力棒就交给了那些一直在努力学习希腊语的人文学者。随着人工智能变得更快、更准确,接收其输出并将其转化为意义的人的存在变得更加重要。这大概是一种不只限于卷轴故事的预感。

仔细想想,那个化成木炭的卷轴一直就在那里。在图书馆的书架上,在博物馆的档案馆里,就像黑色的圆柱体一样。因为它们不可读,所以被认为毫无价值,但它们并没有被扔掉,而是等待着有人可以阅读它们的那一天。一旦技术赶上来,它就变成了文档。如果,即使在此时此刻,世界上还有一些我们根本无法阅读的东西正在沉睡,那么我们手中的东西不仅是破译的工具,而且还涉及到应该留下什么的问题。

还有600多卷未打开的卷轴。作为一名读者,我期待听到下一个声音。如果你也看看过去的文章,你就能更立体地看到这两年的进展。