"新日本古典籍综合数据库"介绍

▾ 名称:新 日本古典籍総合データベース

▾ 英文:Database of Pre-Modern Japanese Works

▾ 中译:新日本古典籍综合数据库

▾ 链接:点击这里

简介

即便已身处信息时代,学者想要阅览古籍仍不容易。古籍的数字化和公开化是一项长期工作,“新日本古典籍综合数据库”是东亚古籍数据库的一个亮眼范例,向公众开放查阅高分辨率的古籍数字图像。

古典籍(Pre-modern works),指未采用现代印刷技术印制的书籍,在日本语境则具体化为江户时代前的手抄本、木版印刷本等形式的书与籍。“新日本古典籍数据库”由国文学研究资料馆发起,旨在向所有读者公开国文学研究资料馆及其他协作机构的古代典籍资源。

古籍的数字化和公开化不仅能促进古典研究,而且也能惠及教育者、艺术创作者、文化从业者和广大公众,对民族文化存续和公众文化教育有重要意义。

数据

该数据库资料丰富,且一直不停更新中。其2022年4月公布的数据表明,该库已公开了超68万份书目和18万张图像。该库数据有多种来源渠道,比如2022年7月11日最新的一次更新,就有来自大英博物馆的46件书籍藏品,如《伊勢暦》《訓蒙圖彙》等(见下图)。

image

点击图像列的“表示/View”,即可查看任一项的具体信息。

image

如图,左侧为预览图及URI(Uniform Resource Identifier)地址;右侧为各项元数据,包括书籍ID、DOI(Digital Object Identifier)、资源类型(如微缩胶片)、书名等等。点击左侧预览图,即可进入IIIF查看器进行图像阅览。

搜索

网站主页提供了三种搜索功能,分别为书目搜索、图像搜索以及全文搜索。搜索功能支持假名、汉字和罗马字,其转换方法可以在搜索栏下方“Romanized terms”中查看。

image

书目检索是最直接简单的搜索方式。如图,我们键入“料理通”,即可搜索到含有这三个字的所有典籍。在左侧导航栏,可以根据印刷方式、资源类型、作者等选项进一步缩小结果范围。

image

图像搜索可以直接返回图像结果。此外,图像搜索功能还提供了标签搜索功能,并展示了常用的图像标签,比如“文学”类资源中常见的标签为“男、髭、女、烏帽子、刀、僧侶、甲冑、武士”等,而“医学”类则为“傷寒、嘔吐、脚気、霍乱、消渇、中風、咳嗽、頭痛”等。

image

值得令人注意的是全文搜索功能。中文语境中的“全文”很多时候指的仅仅是拥有全文影像(full scan),而非可复制粘贴的全文文本(full text)。目前,该数据库有27部古籍已有全文文本数据并可以进行全文搜索,包括《源氏物語》《保元物語》等。如图,我们搜索“少将”为例,可以得到含有此关键词的文本。

image image

点击第一条搜索结果《保元物語》,即可查看其全文文本。用户也可以点击“图像”选项,直接在IIIF查看器中阅览其原文影像。

简评

我们可以使用“FAIR”原则作为标准评判数字人文项目。“FAIR”代表了数据可用性的四个方面:Findable(可查询)、Accessible(可获取)、Interoperabe(可互操作)、Reusable(可重用)。此数据库很好地符合了这四个方向:其搜索功能强大,数据易查询;用户无需登录,可直接获取书籍元数据和图像;网站提供URI和IIIF的mainifest文件下载,便于用户提取数据进行其他操作;所有数据都开源,许可协议为CC BY。

网站的设计也简洁合理,易于用户上手操作。另外,网站提供了日语和英语两种语言界面,并且为难以输入日文的用户提供罗马字支持,使得整个数据库适用面广,是多语言数字基础设施的良好范例。

古籍作为一个国家和民族的历史宝藏,具有独特的历史和文化价值。这些资源理应开放给公众,大力推广发扬,而非据为己有,各自为营,将公共版权资源资产化谋取利益。我国也应在文化基础设施方面加大投入力度,将公共知识带给更广泛的受众。