美國加州聖地牙哥台灣同鄉會
San Diego Taiwanese Cultural Association
http://www.taiwancenter.com/sdtca/index.html
  2024 年 7 月

解碼古羅馬捲軸挑戰賽
許瑞蘭報導

(編輯室前言:本文大部分節錄自The Race to Decode an Ancient Scroll; 《Scientific American》April 2024, pp. 24 - 30)

維蘇威火山(Mount Vesuvius)位於歐洲義大利南部拿坡里灣 (Naples Bay)的東海岸,距世界名城Naples不到20公里。在公元79年8月24日的火山爆發,灰雲柱直衝33公里高空,每秒噴出150萬噸的碎屑,隨著風向在龐貝 (Pompeii) 城落下了三公分厚的火山灰,屋頂溫度高達攝氏140度。之後,共有六次高達攝氏500度熾熱火山碎屑流的襲擊,當時有2萬多人的龐貝城被火山碎屑摧毀,很多遇難者遺體衣著都保存在火山灰下。直到18世紀中期,考古學家才將龐貝古城從火山灰中發掘出來,古老建築狀況都保存完好,這一史實為世人熟知,龐貝古城也成為義大利著名旅遊勝地。

1709年,農場工人在Naples附近Resina鎮挖井時,在約60英尺深的地方,發現了一巨大的廢墟。1750 年國王查理七世下令挖掘遺址,瑞士工程師 Karl Weber沿著地下牆發現了一座可容納 2,500 人的建築叫「莎草紙別墅」(Villa of the Papyri)廢墟。這座別墅可能是凱撒大帝 (Julius Caesar) 的岳父---執政官Lucius Calpurnius Piso Caesoninus家族所有。在廢墟的一角,工人發現了一堆幾英寸高的黑色畸形圓柱體。這些物品最初被認為是碳化的木頭,有些被扔掉了,直到Karl Weber意識到這房間是一個圖書館,共取出了一千多捲紙莎草捲軸 (Papyri Scrolls) ,這些古羅馬龐貝古城留下莎草紙捲軸和碎片被放置在當地博物館,以它們被埋葬的地方命名為「赫庫蘭尼姆紙莎草卷軸(Herculaneum Papyri Scrolls)」。這些卷軸包含許多希臘哲學文本,成了一個保存完整的古代圖書館。

1753年,不讓歷史化為灰燼,負責監督梵蒂岡圖書館古代手稿的修道士Antonio Piaggio發明一種機器,以每天十分之一英寸的速度慢慢輕輕地將莎草紙張展開,將絲線連接到紙張的邊緣。他花了幾十年時間,研究莎草紙張,希望揭示其中的秘密,他發現了希臘詩人 Epicurean派哲學家Philodemus (BC 110 - BC 35) 用希臘文寫的的作品 (認為原子在虛空中旋轉碰撞創造出宇宙)。幾乎所有的希臘古典文學都是從中世紀的修道士那裡傳下,由修道士們決定傳下什麼,因此古代“原始製做版”的作品較少。現有「悲劇之父」的Aeschylus的七部劇本,但這作家寫的作品至少是10 倍,在別墅尚未挖掘的區域,可能有更多失傳的歷史和科學記錄。

能找到不為人知的文學作品是件大事,Piaggio的做法緩慢又具破壞性,因此多人嘗試其他方法來解碼「赫庫蘭尼姆莎草卷軸」。一位博物館館長粗暴的用刀垂直切開幾個捲軸,發現了一些清晰的文字,但毀了整個卷軸。一位義大利王子,將一些捲軸浸入水銀中希望液態金屬能夠將書頁分開,但摧毀了捲軸。有人試圖將它們暴露在臭的「植物氣體」中或將捲軸塗上玫瑰水,這些都沒效。

2019年美國University of Kentucky計算機科學系教授Dr. Brent Seales領導的團隊,將兩個完整的古捲軸裝在定製的箱子裡,運送到英國 Oxfordshire 的Diamond Light Source (鑽石光源粒子加速器科學裝置) ,利用加速器的高能光子對它們進行 ” 成像”。Seales的團隊以8微米 (相當於一個紅血球細胞的直徑) 的解析度,對莎草紙進行了電腦斷層掃描 (CT scan) 。計劃將加速器掃描的結果,經過電腦程式的演算,以虛擬方式打開每一層莎草紙,以期在紙面上顯示出墨水的痕跡。捲軸是用碳墨寫成,很難用普通 X 光來分開卷軸本身燒焦的書頁。然而卷軸上使用的墨水對高能光子的穿透度和莎草紙相似,掃描中看不出足夠的對比,因此偵測不出。為了解決這問題,Seales的團隊建立了一個機器學習 (Machine Learning) 的模型,該模型用碳墨水書寫的手稿來進行訓練,希望墨水檢測的人工智慧 (Artificial Intelligence) 模型,可以成功展開莎草紙。

46歲的Nat Friedman是北加州灣區投資者,是Microsoft軟體開發網站GitHub的創辦人。他與長期投資夥伴Daniel Gross (搜尋引擎Cue的聯合創始人) 是當今人工智慧的早期資助者。在2010年代,Friedman和Gross就開始資助機器學習研究人員,如今他倆擁有幾可敵國的Nvidia晶片。當一群科技億萬富翁計劃在三藩市北部建造一座烏托邦式的完美城市時,Friedman也投資這個專案。2020年春天,COVID新冠病毒瘟疫大流行,Friedman在三藩市的家中隔離, 希望把注意力從COVID移開。當他知道 Seales教授的團隊在解碼古卷軸的研究有突破進展時,他想也許矽谷的人工智慧先行者,可投資該專案或提供專業知識,一起解決這解碼問題。

2022年,Friedman邀請Dr. Seales參加Frontier Camp,這 Camp 是由Friedman組織的秘密聚會,大約 200 名精心挑選頂尖的科技人士,每年都會在北加州的偏遠樹林中露營,分享他們的創意。對Friedman的邀請,Dr. Seales 起初並不在意,他曾聽過Friedman這個人,但不相信這電子郵件是真的。然而Friedman頑強不死心,一直持續不停地邀請Seales,最後 Seales 在2022 年 10 月接受邀請,抵達了Sonoma County紅杉林中的Spartan營地,向一群機器學習工程師演講,受到熱烈歡迎。

當露營快結束時,Friedman和Gross擔心Seales會空手而歸,於是那天晚上,在 Seales 下榻 Palo Alto 旅館的酒吧,Friedman一邊喝著Bourbon威士忌,一邊商討建議合作,並且具體希望舉辦一場有獎公開賽。Friedman告訴Seales,他願意提供巨額獎金,以鼓勵全世界的有心人士參加,更多人的努力可讓解碼速度更快。

Seales飛回University of Kentucky後,和他的團隊討論,最後大家一致同意Friedman的兩項建議:(1)舉辦公開賽和(2)提供獎金。Friedman知道結論後欣喜若狂,在他的Twitter(現在的X)上寫道: 「正在研究一個非常令人興奮奇怪的新專案,像是一輩子的夢想。」

2023年三月,GPT-4 的發布,人工智慧爆炸性成長, Seales 團隊與Friedman (比賽贊助商之一) 以被埋葬的火山(Mount Vesuvius)命名,正式發起「維蘇威挑戰賽The Vesuvius Challenge Contest」,為「解碼古代卷軸挑戰賽」提供 100 萬美元獎金,盼用人工智慧破譯這些碳化古卷軸中的內容。

他們為參賽者提供伺服器站平臺 Discord.com, (Vesuviuschalllenges, Scrollprize.org)。Seales團隊發佈了軟體和數千張3D X射線圖像,包括三張莎草紙碎片 (Shredded papyrus) 和兩張捲軸,希望全球接受這一挑戰。最初幾周大約四百多名註冊,在秋天時有一千多名,最後共有 2,763 名參賽者和團隊報名,包括中國哈爾濱工業大學的兩名學生、來自烏克蘭基輔考古學家團隊、德國的醫學成像研究小組以及日本和韓國的機器學習工程師。參賽者對古代的歐洲瞭解很少,不會說希臘語,拉丁語。他們感興趣的是技術問題,及維蘇威火山挑戰賽 100萬美元的集體獎金。

參賽者下載兩張卷軸的5.5TB掃描圖像(PHerc_Paris_3和 PHerc_Paris_4),Seales給它們起了兩個綽號: “香蕉男孩Banana Boy”和“胖混蛋Fat Bastard ”。為了促進墨水檢測的進展,召集人在數據科學在線平臺Kaggle上(The world’s largest data Science community) 發起了機器學習測試(Machine Learning Competition),獎金10萬美元。

2023年8月底,一週六晚上,University of Nebraska的 21歲的Luke Farritor (也是 SpaceX 實習生) 獨自坐在Omaha一個家庭聚會的角落,他的iPhone響起,它來自British, Columbia的 45 歲計算機科學家和鋼琴家 Ben Kyles。Farritor 稱他為“ Hari Seldon” (以Isaac Asimov 基金會系列中的一個角色命名)。Kyles說他剛剛完成了對碳化莎草紙高解析度掃描,已經把這些圖片上傳到共享伺服器站平臺 (Discord.com) 。Kyles和他的分割工團隊每小時能夠生產出大約 0.2平方英寸的紙莎草紙表面。(捲軸的長度可超過 32 英尺)。在過去六個月,Farritor一直試圖破譯這些卷軸,他用手機遠端撥通了他位於Lincoln 的學生宿舍的電腦 (距離約一小時車程)。他在伺服器上找到 Kyles的碳化莎草紙片段,將其輸入到他自己構建的人工智慧探測器中。檢測器程式為查找墨水設計,查找字母,從而查找單詞,他啟動了程式運行。作為聚會指定的司機,Farritor等待聚會結束,把朋友送回宿舍後,他解鎖了手機螢幕。人工智慧輸出了一些東西!在手機螢幕上,在莎草紙的灰度縱橫交錯的紋理的襯托下,是三個黑色小寫的希臘字元,排列清晰,很模糊,但明確無誤:pi (π)、omicron (ο)、rho (ρ)——“πορ”。在 University of Nebraska-Lincoln 的一停車場,他瞥見了2千年前古卷軸希臘字元。“我嚇壞了”!他發了一張截圖給媽媽。他想:「包含這些字母的單詞是什麼?哪本書裡有這個詞?」

Kyles 間接促成 Luke Farritor的發現。Farritor首先以解析圖案的演算法,他利用舊的 Nvidia GeForce GTX 1070 和這些裂紋圖案創建一套機器學習演算法,能辨識卷軸部分較清楚的字母,他成功辨識出古希臘單字「πορφυρας」(porphyras紫色)。

30多歲的物理學家Casey Handmer (生於Australia) 是加州Terraform Industries 公司的創始人 (利用陽光和空氣生產碳中和天然氣)。5月, 他花了幾個小時檢查Kyles的這些圖像,發現自己越來越熟悉燒焦的莎草紙纖維的視覺特徵。他一直看到一種反覆出現的紋理,看起來像在莎草紙表面烘烤的破裂的泥土。經過一個小時左右的強烈凝視,他注意到一個倒置的π。Handmer在其他字母的形狀中發現了更多這種紋理,甚至相信他已經發現了 “Calliope”(Καλλιόπη), 這個詞是Epic poetry史詩Muse的名字。然而,他的發現未能說服六位莎草紙學家 (他們在6月評估第一字母獎,40,000美元的競賽,第一個在0.6平方英寸的區域內找到10個字母的人) 。但Handmer幾乎即時與留言板平臺Discord區分享他的突破,他為重大研究鋪平了道路,為此他獲得了 10,000 美元的獎金。

當Farritor得知 Handmer發現裂縫紋理時,他正在Texas的SpaceX實習。他整天都在Starship的發射台軟體團隊工作 (Starship是有史以來最強大的火箭) ,他大部分下班時間都在構建一個人工智慧,以找到更多破裂的紋理。同時,Free University of Berlin的埃及數據科學博士生Youssef Nader正在研究一個系統,該系統是他從成功的Kaggle競賽模型中改編而來的。 Nadar 是 2023 年 10 月頒發的挑戰賽第一部分的亞軍。參與者只透露了卷軸上的幾個單詞,包πορφύραc,意思是“紫色染料”或“紫色衣服”。

Farritor和 Nader 都找到了字母序列。Nadar的結果更乾淨,但Farritor更快。在八月底聚會當晚找到πορ後,Farritor繼續改善他的設計模型程式,直到它在πορ周圍看出幾十個模糊的形狀,也可能是希臘字母。9月,紙草學家檢查了Farritor的結果,Naples University莎草紙專家 Federica Nicolardi協助驗證,他們意識到 πορ是 πορφύραc 或porphoras(古希臘語中“紫色”的意思)的開頭。Farritor成功破譯古羅馬莎草卷軸一個單詞,比賽召集人之一JP Posma遞給Farritor一張4 萬美元獎金的大支票。就在紙草學家研討會時,Nader發現了同樣的單詞,獲得了第二名的10,000美元。他發佈了一張圖片,在四列完整的文本中顯示了πορφύραc——這是莎草紙學家在有生之年從未見過的景象。在Nader專欄中還有其他可識別的單詞,包括可能的短語 κατάμουσικήν(kata mousikēn),意思是 “與音樂有關”。根據Naples University莎草紙專家 Nicolardi的說法,這卷軸可能是一部哲學作品。

Julian Schilliger 是瑞士研究Robotic機器人的學生,他早期的軟體獎可以加速 segmentation思維並以three dimensions繪製莎草紙。2023年底,Youssef Nader ,Luke Farritor 與 Julian Schilliger三名學生合作組成團隊。2023年12 月,這個三人團隊,在各自完成的工作,結合了他們的方法將捲軸分成多個部分, 使用 CT 掃描對文字進行 3D 掃描後,機器學習模型(人工智慧的一種應用)檢測墨蹟區域 模型,跟蹤墨水點,這些墨水點後來被聚合為字元母。三人組在掃描上訓練機器學習演算,他們的人工智慧模型能夠從卷軸上讀取2000個字元,約佔卷軸的 5%, 遠遠超過了大獎的標準 (參賽者必須揭示四個段落,每個段落 140 個字元) 。這一小古卷軸,可能是Epicurean 哲學家Philodemus寫的音樂、食物以及如何享受生活的樂趣。Epicurean的觀點是在沒有痛苦或恐懼的生活中追求快樂。
共有 18 隊參加比賽,最好的結果被送給一個國際莎草紙草卷學家 (papyrologists ) 團隊評估每個參賽作品的可讀性,並努力轉錄文本。 2024 年2月5日,維蘇威火山挑戰賽授予這個三人團隊70萬美元的大獎。

對於莎草紙學家來說,最令人驚喜的是人工智慧找到可識別字元的速度。Federica Nicolardi 的同事-- Napoli University Campania Luigi Vanvitelli的莎草卷軸教授Gianluca Del Mastro看著Nader的專欄時含淚說:「從“πορ”三個字元到整個單詞和短語,然後是一列列文本。Farritor、Nader和 Schilliger,3 個學生花了一個月的時間,通常需要莎草紙卷學家20年的深入研究」。

維蘇威挑戰賽的創始人, Friedman在第 2 階段2024 年目標是在獲勝團隊的方法基礎上,使用高能物理掃描四個捲軸 ( 從 5%卷軸增加到 90%)。挑戰賽已經宣佈了 2024 年大獎,以及另一系列的進步獎,希望能夠在未來幾年內閱讀所有 800 個卷軸的全部內容。

感謝一群年輕業餘的人工智慧研究構建者,今天我們有工具可以閱讀赫庫蘭尼姆莎草紙卷軸。幫助確認獲獎作品的University of Oxford的古典學者Tobias Reinhardt說:「如果該技術繼續進步, 有望能推廣到許多尚未打開的古卷軸,自文藝復興以來,前所未見的古文本將重現於世間」。

1993 年,在Petra, Jordan的一Byzantine教堂中發現了 140 個西元 6 世紀的莎草紙卷軸,數以萬計的脆弱片段粘在一起從未被閱讀過,死海古卷 (Dead Sea Scrolls) 從未被閱讀過。”維蘇威火山挑戰賽”開發的技術,可以用於破譯Naples灣以外的其他失傳文本。古埃及木乃伊面具也是用莎草紙製成的,層層排列著塗有石膏,一種做紙盒的紙漿材料。莎草紙上經常有文字,如果不破壞石膏,就很難破譯。那些紙莎草紙現在也可能有來世。西元前四世紀希臘歷史學家Xenophon從Mesopotamia返回時指出,黑海的捲軸貿易繁忙,這幾乎可肯定海底有沉船,裡面有成箱的紙莎草紙卷,密歇根大學古典學教授兼莎草紙學家Richard Janko說。這些捲軸可能仍然保存在氧氣和鹽度非常低的黑海海域中。

人工智慧可讓碳化莎草紙說話。

後記:人工智慧 (AI)醫學應用於癌細胞檢查的電腦斷層掃描,影像分析的技術可以在不使用顯影劑的情況下,檢測可能存在的癌細胞或其他病變。技術正在快速發展,有望改善早期發現和治療癌症,同時減少對患者的不必要侵入性檢查。