你知道這幾個甲骨文分別是什么字嗎?

這三個字翻譯過來是“人”、“車”、“林”。如果這些比較好猜,那再來看看這幾個字。

其實這些字我們和甲骨文專家也都不認(rèn)識。我們稱它們?yōu)椤拔醋R字”。
在已知近4000個甲骨文單字中,成功破譯約1160字,而其余三分之二的甲骨文仍然是難啃的硬骨頭。“考釋難度很大的字,它基本上都是一些人名、地名,這些人名、地名在現(xiàn)代已經(jīng)不再使用了,我們離商朝太遠(yuǎn)了。”中國文字博物館文物征集部研究中心助理館員劉浩告訴我們。
考釋甲骨文難度極大。曾有學(xué)者說“釋出一字,好比發(fā)現(xiàn)一顆新的行星”。2016年,中國文字博物館面向社會發(fā)出的懸賞令——破譯一個甲骨文獎勵10萬元。但8年來,“摘星者”屈指可數(shù)??坚尮ぷ髯⒅剡壿嬐茖?dǎo),不僅要釋讀出這個字,還要連綴上下文。然而,甲骨拓片和相關(guān)的研究成果,散見于各類出版物和網(wǎng)絡(luò)平臺,有一定的滯后性。在甲骨文研究過程中,往往按照傳統(tǒng)方法,學(xué)者需要翻書查閱甲骨拓片,耗費大量的時間精力。將甲骨文進(jìn)行材料整理、信息整合,是甲骨文研究走向數(shù)字化的第一步。
中國文字博物館文物征集部研究中心助理館員劉浩表示:“如果能夠數(shù)字化整理,就能節(jié)約研究者相當(dāng)多的時間去做更深入的工作。不然的話,像現(xiàn)在,我們古文字的學(xué)者研究甲骨文的話,他入門就可能會需要10年時間?!?/p>

甲骨綴合是甲骨文研究中的一項重要工作,專家綜合各方面信息,將碎片拼接成完整或較為完整的卜辭。然而,甲骨碎片的拓片圖分散在不同出版物和網(wǎng)絡(luò)平臺,非常不便于查找?!拔页鯇W(xué)甲骨的時候,因為對這方面都比較陌生,在找尋甲骨綴合信息的過程中碰到了很多困難,我非常希望能夠有這樣的檢索工具?!睆?fù)旦大學(xué)出土文獻(xiàn)與古文字研究中心博士生程名卉告訴記者。
為了方便學(xué)者更加便捷找到甲骨綴合的信息,縮短研究前期資料收集階段的時間,復(fù)旦大學(xué)出土文獻(xiàn)與古文字研究中心的博士生楊熠、黃博、程名卉共同聯(lián)手打造了“綴玉聯(lián)珠”甲骨綴合信息庫,匯集了《甲骨文合集》出版以來眾多學(xué)者的甲骨綴合成果6700多組。“學(xué)者綴合的專書、散見的文章、海外期刊,大陸期刊、集刊、網(wǎng)絡(luò)發(fā)表的文章,還有甲骨收藏單位和發(fā)表單位發(fā)布的信息,我們?nèi)慷紖R集甲骨綴合信息庫中?!睏铎诮榻B。

每一組綴合完成的甲骨文都有一個編號,注錄都有統(tǒng)一的格式體例。通過檢索編號,綴合出自何處,如何拼接而成,一目了然。
信息庫2023年2月上線,現(xiàn)在已經(jīng)獲得了300多萬訪問量,這不僅成為學(xué)界檢索甲骨綴合主要成果的線上工具,也讓不少象牙塔外的甲骨文愛好者有機(jī)會共同參與甲骨碎片的“破案”工作,提供勘誤和新的甲骨綴合信息。
“如果未來我們甲骨學(xué)或者古文字研究要往跟AI合作的方向去發(fā)展的話,我們必然會需要有很多大量的數(shù)據(jù)標(biāo)注跟數(shù)據(jù)基礎(chǔ),相當(dāng)于我們現(xiàn)在正在進(jìn)行這個數(shù)據(jù)基礎(chǔ)的步驟。”程名卉說。
近年來,各大高校聯(lián)合科技企業(yè)紛紛研發(fā)打造甲骨文數(shù)字化平臺,殷契文淵甲骨文大數(shù)據(jù)平臺、綴多多甲骨綴合軟件、甲骨校重助手等工具陸續(xù)上線。通過大數(shù)據(jù)、人工智能等技術(shù)集納、研判、拼合,逐漸由學(xué)者的構(gòu)想變?yōu)楝F(xiàn)實。
騰訊優(yōu)圖高級研究員羅棟豪介紹:“拓片和摹本不一定能夠把甲骨片上的細(xì)節(jié)信息還原得非常清楚,我們目的是通過算法,讓甲骨文‘看得清’和‘找得到’?!?/p>

2023年,安陽師范學(xué)院、騰訊、廈門大學(xué)等團(tuán)隊共同研發(fā)甲骨文全信息模型,嘗試實現(xiàn)甲骨文實物的高保真數(shù)字還原,以及甲骨文字的高效率數(shù)字查找。
甲骨文信息處理教育部重點實驗室主任劉永革介紹:“去年我們做了實驗,對考古隊的80多片甲骨進(jìn)行采集。為了我們看清甲骨的刻痕,用光照矩陣的形式,用1億像素的相機(jī)進(jìn)行拍攝,一個甲骨片正面拍150張,背面拍150張,再合成一張高清圖片。”
完成高精度數(shù)字采集后,團(tuán)隊運用微痕增強(qiáng)技術(shù),將科學(xué)影像等信息分類分層,高保真看清甲骨實物上的文字起筆收筆、鉆鑿形態(tài)、卜兆裂紋。“增強(qiáng)效果以后,甲骨字的刻痕清晰顯現(xiàn),筆畫疊壓關(guān)系也能看得非常清楚,這個信息在拓片上是看不出來的?!眲⒂栏镎f。

同時,他們研發(fā)了“字形匹配”等人工智能算法,實現(xiàn)以字搜字、以字搜圖,形成古文字智能搜索組件,沉淀了143萬字的單字字形庫。這些單字均可索引至原拓片,然后基于清晰字形數(shù)據(jù)訓(xùn)練的字形匹配算法,為任意甲骨單字字形在字形庫中檢索與其字形相似的單字,并按照相似度進(jìn)行排序。“可能給專家提供一些線索或者是靈感,這兩個字可能在字形上面,有這種關(guān)聯(lián)性,可以大大縮短專家在考釋過程中查找相似字形的時間?!绷_棟豪介紹。
近幾年,人工智能技術(shù)在古文字研究領(lǐng)域有許多令人驚喜的成果。2022年,人工智能團(tuán)隊Deepmind用深度神經(jīng)網(wǎng)絡(luò)伊薩卡修復(fù)古希臘受損的石碑銘文,修復(fù)準(zhǔn)確率提升了47%。2024年,三位來自埃及、瑞士和美國的大學(xué)生通過人工智能技術(shù)攻破了2000年前碳化的上古卷軸,目前破譯了近5%的內(nèi)容。
中國文字博物館文物征集部研究中心助理館員劉浩表示:“這是由文字的特性決定的。它們表音文字實際上是由字母組成,識別的難度遠(yuǎn)遠(yuǎn)低于漢字。像甲骨文的話,有很多表意的成分,它就有隨機(jī)性,這一部分就需要建立特別的規(guī)則去映射,其實這個難度就很大。在我們目前對甲骨文研究,都還無法做到人工智能破譯這一點?!?/p>
龜甲或獸骨上的文字、爆裂的紋路,鉆鑿的圓孔,火燒的痕跡,都將隨著時間逐漸變淺,甚至消失。甲骨質(zhì)地脆弱,表面疏松粉化與殘損的情況普遍發(fā)生,保存、展示、利用都很不易。近16萬片甲骨分別收藏于國內(nèi)外博物館、圖書館、科研機(jī)構(gòu)、高校等至少174家機(jī)構(gòu),要想從物理形式中把甲骨重新集中起來進(jìn)行研究困難重重。
復(fù)旦大學(xué)出土文獻(xiàn)與古文字研究中心博士生楊熠表示:“甲骨文16萬片,我們現(xiàn)在只能真正看到拓片或者照片的一共只有8萬片,實際上還有一半的材料都沒有公布。如果是這部分材料能夠以某種形式,比如說數(shù)字化的形式推進(jìn)公布的話,對整個甲骨文研究的推進(jìn),我想應(yīng)該是非常大的。”
甲骨文數(shù)字化服務(wù)資源建設(shè),尤其是以大數(shù)據(jù)、人工智能為技術(shù)基礎(chǔ)的甲骨文數(shù)字化工程,可以最大程度地保存甲骨及其承載文字的原始信息。散落世界各地的殷墟甲骨以數(shù)字化形式回歸故里的日子,不再遙遠(yuǎn)。
騰訊優(yōu)圖高級研究員羅棟豪表示:“我們想通過技術(shù)化的手段,讓甲骨片能夠永久停留在我們給它建模的時間段。因為數(shù)字化不存在信息的流失或者損壞?!?/p>
2017年10月30日,聯(lián)合國教科文組織將甲骨文選入《世界記憶名錄》。數(shù)代前賢學(xué)者前赴后繼、不懈努力地守護(hù)歷史。如今,用數(shù)字化的形式或許可以永久地保留這份遺產(chǎn),讓這些珍貴的數(shù)據(jù)信息永續(xù)留存,煥發(fā)新生。
| 編輯: | 王玨 |
| 視頻編輯: | 劉奕達(dá) |
| 美術(shù)編輯: | 李佳 郭浩 |
| 攝像: | 李響 劉寬漾 朱曉榮 |
| 責(zé)編: | 王琳琳 |

劍網(wǎng)行動舉報電話:12318(市文化執(zhí)法總隊)、021-64334547(市版權(quán)局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權(quán)所有

全部評論
暫無評論,快來發(fā)表你的評論吧