3000多年前的文字,AI如何輔助破譯?近日在武漢,華中科技大學未來技術學院團隊正在用人工智能提供輔助破譯我國最早文字的方法。
華中科技大學未來技術學院團隊與安陽師范學院的甲骨文專家展開交流。
甲骨文是迄今為止我國發現的年代最早的成熟文字系統,是漢字的源頭和中華優秀傳統文化的根脈。自1899年甲骨文被發現,迄今已有不重復的單字約4500個,其中已破譯約1600個,仍有約2/3的甲骨文等待破譯。有學者曾說“釋出一字,好比發現一顆新的行星”。
為何如此之難?中國文字博物館文物征集部研究中心助理館員劉浩此前表示,甲骨文有很多表意的成分,具有隨機性,需要建立特別的規則去映射,難度很大。目前都還無法做到人工智能破譯。
華中科技大學未來技術學院團隊成員
今年,華中科技大學未來技術學院團隊勇闖“無人區”。該學院大三學生管海粟介紹,經過多方走訪調研和一年多攻關,團隊成功構建了甲骨文開源數據集。這一數據集,分別包含了1600余類別甲骨文文字及眾多未破譯的甲骨文單字、13000余類別甲骨文演變階段中產生的其他文字。
不僅如此,團隊還訓練模型OBSD,并開發出基于人工智能的多途徑輔助破譯系統Open-Oracle。經過幾個月的訓練和優化,模型逐漸掌握了古文字的演變規律,并能預測甲骨文文字圖像在現代可能呈現的字形。
新質生產力的工具為甲骨文文字破譯提供了可能的線索。團隊導師、華中科技大學軟件學院教授、機器視覺與智能系統湖北省工程研究中心主任白翔向長江日報記者介紹,目前來看,新工具可能具備“推演”出甲骨文新文字的潛力,這將有助于更好傳承發展中華優秀傳統文化的根脈。
中國社會科學院學部委員、古代史研究所研究員宋鎮豪曾表示,作為世界上最古老的自源文字之一,漢字是唯一沿用至今的,對破解其他古文字也能起到重要借鑒意義。