中新社(shè)北京5月(yuè)18日電 (記者 孫自法)中國海外(wài)古籍“數字化回歸”項目“漢典重光”平(píng)台(tái)18日下午在北京中國科技館正式(shì)發布,通過先進的人工智(zhì)能(AI)技術,一批珍藏于美國加州大學伯克利分校的中文古籍善本,以數字化方式(shì)回歸故土(tǔ),落地“漢典重光”古籍平台。
“漢典重光”平台(tái)稱,首批20萬頁古籍已完成數字化,并(bìng)沉澱為覆蓋3萬多字的古籍字典,公衆(zhōng)可通過該平台翻閱、檢(jiǎn)索古籍,這20萬頁古籍(jí)的識别準(zhǔn)确率達到97.5%。
“漢典重(zhòng)光”項目由阿裡巴巴公益基金會、四川大學(xué)、美國加州大學伯克利分校、中國國家圖書館、浙江圖書館合作開展,旨在尋覓流散海外的中國古(gǔ)籍并将其數字(zì)化(huà)、公共(gòng)化,讓普通人也(yě)能親近古籍,通過古籍與(yǔ)先賢對(duì)話,與優秀傳(chuán)統文(wén)化對話。
2019年,阿裡巴(bā)巴和四(sì)川大學提出“數字化回歸”設(shè)想,獲得中(zhōng)文藏書量排名全(quán)美第三的加州(zhōu)大學伯克利分校支持并達成共識,将伯克利東亞圖書館(guǎn)的(de)中(zhōng)文古籍善本逐步數字化。
本次首批數字化的20萬頁古籍中(zhōng),包含40餘種珍(zhēn)貴宋元刻本、寫本;明清至民(mín)國時期*學者錢謙益、翁方(fāng)綱、王韬的抄本(běn)、稿本;*藏書樓嘉業堂、密韻樓的抄本,還有清文瀾閣《四庫(kù)全書》零本等。
為将伯克利提供古籍(jí)的掃描圖片和編目數據全部(bù)文(wén)字化,阿裡巴巴達摩院技術(shù)團隊與四(sì)川大學*聯手研發出一套全新的古籍識别系統,以(yǐ)97.5%的準确(què)率完成對20萬頁古籍的整體識别。目前,該系(xì)統已(yǐ)能批量識别百本古籍,并沉澱覆蓋(gài)3萬多字的(de)古籍字(zì)典。
比起*錄入(rù),這套人機交互的識别系統将(jiāng)效率提升近30倍。随着(zhe)古籍識(shí)别(bié)規模的擴增,機器還會自我進(jìn)化,不斷提升準确率(lǜ)和效率。阿裡巴巴達(dá)摩院院(yuàn)長張建(jiàn)鋒表示,阿裡計劃将這套技術工具(jù)連同古籍數字化平台一并捐贈,交由權威公共機構(gòu)長期運營,同時(shí),阿裡仍将在古籍數字化工作上(shàng)持續(xù)投入人力物力。
據了解,因邦交(jiāo)、貿易、戰亂等,曆史上中國古籍時有出海(hǎi),近代以來,戰争和動蕩更(gèng)加劇了古(gǔ)籍的損毀和流散。據不完全估(gū)計,散居海外的中國古籍超過40萬部(bù)、400萬冊,包括甲(jiǎ)骨簡牍、敦煌(huáng)遺書、宋元善本(běn)、明清精椠、拓本(běn)輿圖、少數民族文獻(xiàn)等。(完)
本(běn)文轉載自中國新聞網(wǎng),内容(róng)均來自于互聯網,不代(dài)表本(běn)站觀點,内容版權歸屬原作者(zhě)及站點所有,如(rú)有對您造成影響,請及時聯系我們予以删除!