記者 姚雪青
瀏覽“江蘇省珍貴古籍數(shù)字資源集成平臺”,如同漫步在歷史長卷中?!锻豆P集一卷》《憺園文集三十六卷》等文集有序排列在電子書架上,點開一看,古樸厚重的線裝書一頁一頁、圖文并茂地呈現(xiàn)在眼前。
近日,南京圖書館“清人文集數(shù)據(jù)庫”上線。作為“江蘇省珍貴古籍全文影像數(shù)據(jù)庫”項目第一期成果,該平臺目前共收錄清人文集400部,以全本彩色掃描的方式制作成13萬余幅高像素數(shù)字圖像,并帶有檢索功能,在全網(wǎng)發(fā)布。
“南京圖書館館藏的清刻本有7萬多冊,其中不少是清人文集。”南京圖書館歷史文獻部主任、江蘇省古籍保護中心副主任陳立說,本次南京圖書館發(fā)布的數(shù)據(jù)庫,便是結(jié)合館藏優(yōu)勢,以圖像數(shù)據(jù)庫形式,集中公布了一批具有相同主題的珍貴文獻。值得一提的是,這其中有許多“罕見”文獻,甚至有些還是僅存“孤本”。陳立介紹,例如嘉慶時期刻本吳俊《榮性堂詩集》、潘奕雋《三松堂集》等,都是存世較少的清人文集。
這些古籍是怎樣從圖書館庫房被“搬”到網(wǎng)絡(luò)平臺的呢?
陳立介紹,古籍數(shù)字化過程分為兩步。首先,要將古籍進行掃描。古籍掃描使用專用非接觸式掃描儀,通過高像素照相機,盡量不按壓古籍頁面進行拍照;采用的光源是防紫外線的LED燈冷光源,圖片顏色不能失真,要用色卡比對。
掃描完成后,就要對這些原汁原味的圖像做數(shù)據(jù)化處理,做至少深入到第二層級的標引,方便使用者按子目檢閱相關(guān)內(nèi)容。記者看到,每種文獻的序和跋都進行了單獨標引,通過檢索可以單獨搜索出來。“古籍的序和跋中不乏名家作品,具有較強的文學和研究價值,如《莫愁湖風雅集》中就有姚鼐作的序。”陳立介紹。
平臺的開發(fā)建設(shè)也至關(guān)重要。一方面,要完整、全面地給古籍“搬家”,還要方便、快捷地幫助使用者找到相應內(nèi)容;另一方面,還要給后續(xù)發(fā)布的方志、家譜等多種類型的古籍文獻“搬家”預留接口。
古籍數(shù)字化的最大挑戰(zhàn),一是專業(yè)知識,二是技術(shù)。“從事這項工作,需要懂歷史學、文獻學、目錄學等的復合型人才,還要有甘坐冷板凳的精神。”陳立坦言,南京圖書館對古籍文獻進行掃描的工作從15年前就開始了,數(shù)字標引小組也在4年前啟動。正因為有這些基礎(chǔ)準備,“清人文集數(shù)據(jù)庫”才能在近期與讀者見面。
不過,古籍數(shù)字化到這一步還沒有結(jié)束。陳立介紹,古籍數(shù)字化的2.0版,將為古籍愛好者梳理浩如煙海的文字背后的知識邏輯順序,制作專題知識圖譜型數(shù)據(jù)庫,甚至可將部分書中內(nèi)容制作成“數(shù)字文創(chuàng)”,讓曾經(jīng)束之高閣的古籍更好走進千家萬戶。