"A DATABASE OF MEDIEVAL CHINESE TEXTS"介绍

▾ 英文:A DATABASE OF MEDIEVAL CHINESE TEXTS,简称 DMCT

▾ 译名:中古写本资料库

▾ 链接:点击这里

简介

“中古写本资料库”是一个佛教材料数据库,由比利时根特大学佛学研究中心与台湾中华佛学研究所共同合作开发。数据库的内容主要包括经过标注的写本数据集,以及由研究人员整理的写本中的异体字数据集。该数据库选择“开放”形式为读者提供所有资料,读者可以使用其数据进行学术研究。根特大学也在硕博士课程教育中使用此数据库内容。

数据集

该数据库内目前含有三部分文本数据集:第一部分为“DMCT项目”本身的数据集,包括部分早期禅宗文献、禅歌、变文等;第二部分为敦煌的禅宗写本;第三部分为《祖堂集》及相关资料。具体文献目录如下:

  1. DMCT写本
    • Early Chan doctrinal texts (早期禪宗文獻)
      • 菩提達摩南宗定是非論
      • 南宗定邪正五更轉
      • 南陽和尚頓教解脫禪門直了性壇語
      • 頓悟大乘正理決──敦煌遺書─S.2672
      • 淨覺注般若波羅蜜多心經─ S.4556
      • 達摩禪師論──敦煌遺書
      • 澄心論──敦煌遺書
      • 稠禪師藥方療有漏──敦煌遺書─P.3664
      • 二十二問──敦煌遺書
      • 壇法儀則
      • 夜坐號
      • 大乘無生方便門
      • 頓悟真宗金剛般若修行達彼岸法門要訣
    • Chan songs and appraisals (禪歌/禪讚)
      • 佛說楞伽經禪門悉談章
      • 大晉河西敦煌郡釋門法律張氏和尚生前寫真讚
      • 前河西都僧統故翟和尚邈真讚
      • 五更轉南宗贊
      • 大興善寺禪師沙門定惠讚
      • 第七祖大照和尚寂滅日齋讚文
      • 稠禪師解虎讚──敦煌遺書
      • 勸諸人一偈──敦煌遺書
      • 證道歌(禪門秘要訣)──敦煌遺書
      • 泉州千佛新著諸祖師頌-S.1635
    • Transformation texts (變文)
      • 破魔變
      • 孟姜女變文──敦煌遺書
      • 張議(義)潮變文
      • 李陵變文
    • Dūnhuáng Avadāna (因緣)
      • 太子成道經
      • 難陀出家緣起
      • 悉達太子修道因緣
      • 歡喜國王緣──敦煌遺書
      • 四獸因緣
      • 醜女緣起
    • Sūtra Lecture texts (講經文)
      • 維摩詰經講經文
      • 妙法蓮華經講經文
    • Records of Auspicious Statues (瑞像記)
      • 諸佛瑞像記
  2. 敦煌文献
    • 傳法寶紀
    • 觀心論
    • 楞伽師資記
    • 菩提達摩南宗定是非論
    • 修心要論
  3. 祖堂集
    • 祖堂集中所含异体字(PDF)
    • 祖堂集内容和结构的综合表格(XLSX)
    • 祖堂集表格备注(PDF)
    • 淨修禪師序言
    • 高麗序言
    • 泉州千佛新著諸祖師頌

文本数据

该库中所有的文本数据均以TEI编辑,保存为XML格式。用户可以在界面中一次性下载所有数据的ZIP压缩包。在该网站的声明页面中可以获取关于技术框架的详细信息。

image

如图,上图为文献的扫描件,下图为XML文件局部。

image

在网页中,我们也可以点击任一条目查看文本。我们以DMCT文本集的《菩提達摩南宗定是非論──敦煌遺書P.2045的數位版本》为例进行查看:

image

如图所示,显示在网页左侧的是“数位文字摹本”。这一版本会尽量还原写本原貌,尽可能以Unicode中所包含的字码来与原文对应,即便文中有错讹也将以原貌呈现。而尚未被Unicode收录的字形,当用户鼠标滑动至该字,会在右上角显示其字形图片。

image

如果读者想要阅读处理好的标准版本,则可参见网页右侧的“标准字体化版”。该版本经研究人员整理加工而成,其中所有异体字都以通用的标准字形来书写,修订了文中错误(以绿色标注),并添加了十分详尽的注释。在两个版本中,破损和模糊的字都以方框表示。

异体字数据库

该库另外还含有一个异体字数据库,用以储存项目内所有文献的异体字信息。网站提供了查询功能,用户可以在搜索框内键入想要查询的汉字进行检索。

image

如图为异体字数据库用户界面。该页面展示了以版本标签为单位的词云,点击标签可以显示该标签下的异体字列表。

image

如图,我们键入“无”字,可以得到所有“无”的异体字列表,包括其他数据如标准字形、编号等元数据。

image

点击展开所有异体字列表,可以同时查看多种异体字形及其元数据。

简评

该数据库内容丰富,专业性强,适合佛教研究相关的师生朋友参考使用。所有数据都在一定条件下开放获取(具体可参见其网页说明),易查易取;文本数据都以TEI标准编写,利于数据的互用和复用。总体而言,该数据库的数据集质量相当高,是一个非常优秀的数字人文实践项目。

此数据库仍有相当大的发展空间。由于佛教写本数量庞大,目前数字化的工作只完成了冰山一角。对写文的数字化依赖于工作人员的专业知识和细心,需要耗费相当大的精力。在网页设计方面,也仍可微调改良。