MCGD(现代中国地理空间数据库)小探
数据库名称:Modern China Geospatial Database
英文简称:MCGD
中文译名:“现代中国地理空间数据库”
出版项目:ENP-China
链接:点击此处
摘要
本文将为大家介绍一个中国地理空间数据库。该数据库由法国研究组织ENP-China制作发行,为从事相关研究的学者提供数字支持。 本文将简单地呈现该数据库的基本信息(主要翻译自其官网),以及分享使用该数据库的实例,供读者参考。
数据库简介
ENP-China项目的全称为“Elites, Networks and Power in modern urban China ”(现代中国城市中的精英、网络和权力)。该研究团队位于法国艾克斯马塞,目前正在开发两个现代中国研究数据库:MCBD(现代中国人物传记数据库)和MCGD(现代中国地理空间数据库)。这两个数据库为研究1830-1949年间中国的人物和地点提供基础资源。所有数据都开源,可开放获取,并提供了API可供调用。 另外,该项目制作了一系列与民国时期中国行政地理相关的综合矢量图层,可以在ArcGIS Online的MCGD存储库中可用。
MCGD数据库有以下几个组成部分:
- 在线地图集(MCDG Online Maps):一个地图集合,在各个级别(省、府、县)重构了中国从1820到1949年的行政地理。其中,1820-1911的数据,来源于哈佛大学优质的中国历史GIS项目;只有1909年的数据,是完全采用了一套新的地图重新创建。对于民国时期,该数据库重新创建了每个子时期的省界,并绘制了1934年的中国县级全图。此外,该地图集内还有一组以地理为参照的历史地图(栅格)。最后,项目组还会发布研究过程中制作的专题地图。
- 位置查找器(MCGD Location Finder):用于根据名称查找识别位置,名称可以为简体或繁体中文或各种音译系统,并提供其地理坐标。
- 批量查找器(MCGD Bulk Finder):一个接口,用于上传包含地名的csv文件并在历史地名词典中解析它们。
- 数据集(datasets):历史地名词典由Postgres数据库中的两个连接文件组成,名称和位置。外部用户无法直接访问PostGres数据库,但数据集会在他们的Zenodo账户上定期保存和更新。
数据库体验
数据集
该数据库共有三个数据集,分别为“晚清民国”、“主数据集”、“共和国”。 如图所示,三个数据集的信息各有不同,但对于广东、四川等省份都有较多数据。其中主数据集所含有的台湾相关数据较多。三个数据集都可以在Zenodo账户上下载。
数据集以csv或xlsx格式储存,读者可用Office软件(如Excel,LibreOffice Calc等)打开,或对其进行更复杂的处理。数据包括城市名称、经纬度、所属省份等等。
地名查找
地名查找十分容易,只需将地名键入(QUERY页面)。可以识别简体、繁体中文,以及现代汉语拼音、威妥玛式拼音。 上图为查找“武昌”的例子。
批量地名查找
除了单个查找,网站还提供了批量查找功能(File Import页面)。用户需要将要查询的城市名称以CSV格式录入,并上传该CSV文件。
如图,我们准备了5个江苏地名和5个广东地名,以纵向表格存储,首行为标题。
上传后,可以点击设置图标,设置CSV文件的读取格式,如分隔符、引号等。点击Launch Query进行查询后,可以批量得到数据,并在地图中显示多个位置。
评价
此项目的数据集质量高,而且为Open Access,十分透明。研究者可以根据自己的研究需求,利用其数据库,或将自己的数据与之结合,可操作性很高。ENP-China项目组目前非常活跃,数据的更新速度快,也能积极回复咨询邮件,有很大的合作潜力。
注:本文部分信息来源于数据库官网。