• 您的位置: 首頁 > 資源動態 > 正文

    引得數字人文平臺

    作者:     發表于:2021-06-17 00:00:00

           1、背景介紹
           引得數字人文平臺是由哈佛大學費正清中國研究中心、臺灣“中研院”歷史語言研究所、北京大學中國古代史研究中心及中文在線四方合作打造的中國古典數據數字人文資源平臺。平臺可以幫助高校及科研院所的學者和學生構建并不斷優化數字人文素養訓練環境、教學環境和研究環境。
          2、平臺介紹
          引得數字人文平臺包含“兩庫兩工具”:中國歷代人物傳記資料庫(CBDB)、中國通用古籍文庫、數字人文文本處理基礎工具和數據可視化挖掘工具。
          3、CBDB特點
          CBDB是全球較早進行數據結構化的大型中國歷代人物關系傳記數據庫,是新文科建設中的里程碑式的研究成果,亦是數字人文研究發展的重要路徑。
    CBDB目前收錄從先秦到晚清約47萬人的傳記、著作資料(約4億字,存儲信息量達2TB),每年新增4萬條傳主和100萬條信息。所收錄的人物主要出自七世紀至十九世紀,其中以唐、宋、明、清的人物傳記資料最為充實。CBDB提供可視化查詢服務,該數據除了可以作為人物研究的參考資料以外,亦可作統計分析、地理空間分析與社會網絡等分析之用。
    相對于傳統的古籍文獻資源庫,CBDB部分是完全結構化的關系型數據庫,以人物為主線,輔以時間、地點、事件和社會關系信息,助力人文研究進入數字人文的新領域。中國歷代人物傳記資料庫(CBDB)不單是史料的電子化,更重要的是為了達到史料的“數據化”。數據化工作產出的數據不僅可以用于全文檢索,還可以用來進行更多樣的查詢和分析,并可靈活地導出到其他軟件,以便進行批量處理,或用不同方式來呈現,如統計表格、電子地圖等。
    和一般對人物數據庫的理解不一樣的是,CBDB既不提供一篇篇的人物小傳,也不包含古籍的全文。它提供的是多個相互關聯的表格, 把人物信息整理出來,放入其中,以便學者進行批量分析。用戶通過對數據庫進行查詢,可以獲得大批人物信息。其中關鍵的是,這些查詢也可以利用人名以外的各種信息,例如地名、官名,甚至是親屬關系、社會關系等,查出一批人物的資料,供學者用于量化分析。通過對研究資料進行數據化,人文學者可以更有效率、更系統地解決既有的學術課題,也可以通過數據發現一些新的問題,供學者參考和分析。
         4、平臺功能
         ①中國歷代人物傳記資料庫(CBDB)
         普通檢索:用戶可通過姓名、地名、官名進行檢索(可支持簡體、繁體、拼音檢索)。
         綜合查詢:可以通過生活的年代、朝代以及籍貫等信息進行檢索。
         顯示包括人物的中英文生平介紹、資料出處、別名、地址、入仕、任官、社會區分、親屬關系、社會關系、著述等信息。
        下載:付費機構用戶可批量下載數據。
         ②中國通用古籍文庫
         收錄中國公私機構現存從先秦至民國撰寫并經寫抄本、刻本、印本、影印的歷代漢文古籍資源約2萬種31億文字。用戶使用賬戶登錄后,可檢索、在線閱覽及下載“引得”數字人文資源平臺收錄的古籍文獻內容資源。
    下載:付費機構用戶可批量下載數據。
         ③數字人文文本處理基礎工具
         工具系統為數字人文研究學者提供文本識別、批量標注、簡繁轉換、自動句讀、命名實體、文本比對的全流程、一站式文本處理工具箱服務,大幅提高文獻數字化、結構化效率,是建設數字人文研究環境、訓練環境事半功倍的組合利器。截至目前,古籍在線OCR工具對豎排古籍識別正確率接近92%,橫排簡體識別正確率接近98%。
         ④數據可視化挖掘工具
         現擁有100余種圖表,無需編程,幫助專家學者輕松應對畢業答辯、成果匯報、項目申請書撰寫、著作編纂等工作,同時可幫助學者發現選題和研究方向。
          5、平臺登錄
          機構用戶:網址為https://www.inindex.cn在機構IP范圍內進入平臺,免登錄,默認獲得機構的相關權限,登錄后將獲得機構和個人個性化特權。
          6、開通時間
          2021年6月7日—2021年10月6日(四個月)
     

    熱門排行
    免费看成年人视频在线观看 - 视频 - 在线观看 - 影视资讯 - 新赏网