Структура данных по историческим персоналиям Китая в China Biographical Database
Секция: Всеобщая история
VII Международная заочная научно-практическая конференция «Научный форум: юриспруденция, история, социология, политология и философия»
Структура данных по историческим персоналиям Китая в China Biographical Database
Data structure on historical persons in China within the China Biographical Database
Mariia Lepneva
post-graduate student, Buryat State University,
Russia, Republic of Buryatia, Ulan-Ude
Аннотация. Цель данной работы состоит в обзоре структуры данных по историческим персоналиям Китая, которые входят в базу данных China Biographical Database (CBDB). С помощью онлайн поискового интерфейса, локальной версии базы данных и руководства пользователя уточняется содержание позиций, по которым систематизирована информация в CBDB, а в соответствующих случаях дается отсылка на полные перечни значений, которые может принимать то или иное поле. Проведенное исследование создает основу для дальнейшей работы с CBDB в изучении истории Китая.
Abstract. The purpose of this paper is to provide an overview of the structure in which data on historical persons of China is organized within the China Biographical Database (CBDB). Using the online search interface, local version of the database, as well as the User Guide, the meaning of various items that hold pieces of information in CBDB is clarified. In appropriate cases, links are provided to underlying sources that give full list of values that a certain variable can take. The accomplished research lays foundation for further application of CBDB in studying the history of China.
Ключевые слова: China Biographical Database; CBDB; база данных; история; Китай; исторические персоналии
Keywords: China Biographical Database; CBDB; database; history; China; historical persons
Введение
Актуальность использования онлайн баз данных для проведения исследования истории Китая определяется тем, что такие базы данных позволяют в структурированном виде аккумулировать большой объем сведений из многочисленных исторических источников, и поисковый интерфейс таких баз данных позволяет легко получить доступ к нужным данным в соответствии с заданными критериями.
В то же время для успешного использования таких баз данных необходимо прежде всего четко представлять, какую информацию они включают. Без этого невозможно определить, какие вопросы, возникающие в рамках исторического исследования, можно, а какие нельзя решить с помощью конкретной базы данных. Все это обусловливает необходимость изучения структуры данных в качестве начального условия использования подобной базы данных.
Объектом данной работы является база данных по историческим персоналиям Китая – China Biographical Database (CBDB), а предметом исследования – возможности ее поискового интерфейса.
Цель работы состоит в рассмотрении структуры данных в CBDB. Для достижения цели предполагается выполнить следующие задачи:
1. провести общий обзор состава и назначения CBDB:
2. использовать поисковый онлайн интерфейс CBDB для получения информации по конкретной персоналии;
3. выделить основные блоки информации по персоналии;
4. изучить особенности внесения информации в каждый из блоков.
Используемый для исследования интерфейс базы данных расположен по адресу (английская версия):
http://db1.ihp.sinica.edu.tw/cbdbc/ttsweb?@0:0:1:cbdbkmeng@@0.8781806794043143.
Китайская версия того же интерфейса расположена по адресу:
http://db1.ihp.sinica.edu.tw/cbdbc/ttsweb?@0:0:1:cbdbkm@@0.3264195112188333
Версия базы данных для скачивания на локальный компьютер доступна на странице:
https://projects.iq.harvard.edu/cbdb/download-cbdb-standalone-database
Официальный сайт проекта расположен по адресу:
https://projects.iq.harvard.edu/cbdb
1. Общая характеристика China Biographical Database
China Biographical Database – это база данных по персоналиям Китая, которая на апрель 2017 г. включает статьи примерно по 370 тысячам персоналиям за период с VII по XIX вв.
Что касается истории создания этой базы данных, она восходит к исследованиям профессора Robert M. Hartwell (1932–1996), создавшего первую версию данной базы. В настоящее время развитие CBDB реализуется как совместный проект Центра китайских исследований Фэйрбэнка в Гарвардском университете (Fairbank Center for Chinese Studies at Harvard University), Института истории и филологии тайваньской Academia Sinica (中研院歷史語言研究所) и Центра исследований древней истории Китая в Пекинском университете (北京大學中國古代史研究中心).
База данных находится в открытом доступе и предназначается для статистических исследований, исследований социальных взаимосвязей, пространственного анализа, а также может быть использована как биографический справочник. На официальном сайте CBDB приводится несколько примеров исследований [1; 2; 3; 4], выполненных с использованием этой базы данных.
2. Процедура получения информации по конкретной исторической персоналии в CBDB
Для рассмотрения структуры информации по персоналии целесообразно выбрать широко известного деятеля, т.к. для него будут иметься сведения по всем доступным рубрикам. С учетом того, что исследования основателя CBDB Robert M. Hartwell сосредоточены на династии Сун, предлагается выбрать фигуру времен этой династии. В качестве такого примера будет рассмотрен китайский философ-неоконфуцианец Чжу Си.
Для получения информации о нем через онлайн интерфейс CBDB воспользуемся поиском по имени (Search by Name), как показано на Рисунке 1.
Рисунок 1. Интерфейс поиска по имени в CBDB
В базе данных находится 16 человек с таким именем, но живший при династии Сун Чжу Си из Цзяньчжоу только один, как показано на Рисунке 2.
Рисунок 2. Результаты запроса на поиск по имени Zhu Xi в CBDB (показаны первые 5 из 16)
3. Основные блоки информации по историческому лицу в CBDB
Выбрав первого в списке Чжу Си, можно увидеть, что информация по нему (как и по любой другой персоналии в CBDB) разделена на восемь основных блоков:
1) Общие сведения (раздел специально не озаглавлен).
2) Географическое положение.
3) Поступление на службу.
4) Должности.
5) Социальный статус.
6) Родственники.
7) Взаимосвязанные персоналии.
8) Тексты.
Рассмотрим, какую информацию можно получить в каждом из блоков. Хотя дальнейшее изложение будет опираться на CBDB User Guide и на базовые таблицы из локальной версии CBDB (20170310CBDBauBase), ссылка на которую приведена в начале статьи, оно не будет касаться вопросов инжиниринга базы данных, но только описывать доступные рубрики информации с пользовательской точки зрения.
3.1. Общие сведения
На выбранном примере Чжу Си общие сведения, которые возвращает онлайн поисковый интерфейс, выглядят, как показано в Таблице 1. Далее отдельные пункты будут пояснены подробнее.
Таблица 1.
Общие сведения об историческом лице в CBDB (на примере Чжу Си)
Name |
Zhu Xi朱熹 |
Person ID |
3257 |
Index Year |
1189 |
Gender |
男 |
Year of Birth |
1130南宋建炎4年 |
Year of Death |
1200南宋慶元2年 |
Age |
71 |
Dynasty |
宋Song |
Alternate Names |
Cangzhou bingsou滄洲病叟(Studio name, Style name室名、別號) ; Diwuyi第五一(Childhood Courtesy Name小字) ; Dunweng遯翁(Studio name, Style name室名、別號) ; Hui'an晦庵(Studio name, Style name室名、別號) ; Huiweng晦翁(Studio name, Style name室名、別號) ; Jiyan季延(Childhood Courtesy Name小字) ; Kaoting考亭(Studio name, Style name室名、別號) ; Shenlang沈郎(Childhood Name小名) ; Wen文(Posthumous Name諡號) ; Wengong文公(Posthumous Name諡號) ; Youlang沋郎(Childhood Name小名) ; Yuanhui元晦(Courtesy name字) ; Yungulaoren雲谷老人(Studio name, Style name室名、別號) ; Zhonghui仲晦(Courtesy name字) ; Ziyang紫陽(Studio name, Style name室名、別號) |
籍貫 |
Jian Zhou建州 |
Choronym |
Wujun吳郡 |
Notes |
Zhu Xi [3257] Shengzheng, p. 2224; Jiangxi TZ, 10.21b; SHY:ZG, 72.33a, 36a. CBD, 1, 587-597.From Hartwell's ACTIVITY table:1181: Apt. Liangzhe Dong tiju1182: In office as Liangzhe Dong tiju1182: As Liangzhe Dong tiju, impeached Tang Zhoungyou.淳祐中從祀孔廟。 《唐代人物知識ベース》記其生卒年為:1130 - 1200. |
相關資料庫連結 |
唐代人物知識數據庫 |
Как видно из Таблицы 1, общие сведения включают 12 позиций, а именно:
1) Имя (Name).
2) Идентификационный номер (Person ID) – это уникальный номер персоналии в CBDB.
3) Год указателя (Index Year). Как поясняется в CBDB User Guide, введения года указателя обусловлено технической потребностью построения базы данных, согласно которой для каждой персоналии должен быть выбран один искусственный код привязки. Правила генерирования года указателя подробно изложены в [5, с.11–13].
В примере с Чжу Си год указателя (1189 г.) сгенерирован по Правилу 1: «Если год смерти лица < (год рождения лица + 60 - 1) , тогда: год указателя = год смерти. В противном случае: год указателя = (год рождения лица + 60 - 1)». Год рождения Чжу Си 1130, соответственно, 1130 + 60 – 1 = 1189 г.
4) Дата рождения (Date of Birth).
5) Дата смерти (Date of Death)
6) Возраст (Age)
7) Династия (Dynasty).
8) Другие имена (Alternative names). Все типы других имен в CBDB можно найти в таблице ALTNAME_CODEв локальной версии базы данных.
9) Базовое местоположение (Basic Affiliation) – совпадает с таковым в следующем информационном блоке, посвященном локализации персоналии в пространстве. Как и год указателя выше, это позиция, наличие которой связано с техническими требованиями организации базы данных, когда должна быть выбрана привязка персоналии к одному конкретному месту. В CBDB User Guide не поясняется, каким образом выбирается «Базовое местоположение», однако в BIOG_ADDR_CODES в примечании поясняется, что «Это поле требует суждения на основе информации в других полях», т.е. также неким образом выводится из других входящих в CBDB данных.
10) Происхождение предков (Choronym). Как поясняется в CBDB User Guide, со времен шести династий и вплоть до конца Тан принадлежность к тому или иному клану была существенным элементом определения социального статуса человека. Начиная же с династии Сун, утверждения людей о принадлежности своих предков к тому или иному клану из конкретного места стало сложно обосновать. Соответственно, под «Происхождением предков» (Choronym) понимается указание на клан и связанную с ним местность. Все варианты «Происхождения предков» приведены в таблице CHORONYM_CODES. Из нее явствует, что в большинстве случаев дается указание на место (например, 陝郡 – округ Шаань) и значительно реже – на принадлежность к клану (например, 明帝族 – Минский императорский клан) или национальности (например, 蒙古族 – монгол).
11) Примечания (Notes)
12) Ссылка на базу данных – Содержит ссылки на другие базы данных, в которых также имеется информация по данной персоналии.
3.2. Географическое положение
Данный блок посвящен локализации персоналии в пространстве [5, с. 20-21]. Его общий вид показан в Таблице 2.
Таблица 2.
Географический блок информации об историческом лице в CBDB (на примере Чжу Си; показана 1 запись из 2)
# |
Address Location |
Address Type |
Sequence of Moves |
First Year at Address |
Last Year at Address |
Address Source |
Address Notes |
1 . |
宋朝--江南東路--歙州--婺源(Wuyuan) |
Household Registration Address本貫 |
|
|
|
宋人傳記資料索引(電子版)Song ren zhuan ji zi liao suo yin (dian zi ban)Index to Song Biographical Materials (頁:3237) |
|
Как видно из Таблицы 2, данный блок включает 7 позиций:
1) Название места (Address Location) – Включает, собственно, название места, а также те более крупные административно-территориальные единицы, в которые оно входит.
Здесь интересно отметить, что, хотя в пользовательском интерфейсе эта информация не отображается, для каждого места в базе данных приводятся географические координаты широты и долготы, что создает возможность для пространственной визуализации и анализа с помощью геоинформационных систем (GIS). Кроме того, база данных учитывает, что в различные историчесие периоды конкретное название могло относиться к разным местам и входить в разные административно-территориальные единицы более высокого порядка.
Так, в примере про Чжу Си, 婺源(Wuyuan) – согласно таблице ADDRESSES в локальной базе данных – с идентификационным номером (c_addr_id) 12855 – это уезд в период с 960 по 1120 гг. с координатами x= 117.84459, y= 29.24473, входящий в歙州 (идентификационный номер 12850), который в свою очередь входит в江南東路 (идентификационный номер 12824), что и отображено (за исключением географических координат) в возвращенных на запрос сведениях в пользовательском интерфейсе.
Подробная методология определения географических координат для того или иного места представлена в [5, с. 20–21].
2) Тип места (Address Type) – указывает на тип связи между персоналией и географической локацией. В случае Чжу Си имеются указания только на два места: Household Registration Address本貫 («Адрес домашней регистрации», т.е. формальный юридический адрес, например, как в списке цзиньши 1148 г.) и Basic Affiliation籍貫(基本地址) («Базовое местоположение», см. пункт 9 в блоке «Общие сведения» выше). Полный перечень возможных вариантов связи между персоналией и местом, учитываемых в CBDB, представлен в таблице BIOG_ADDR_CODES в локальной версии базы данных (в ней также даются пояснения по значениям используемых терминов).
3) Sequence of Moves – Значение этой позиции выяснить не удалось.
4) Первый год в указанном месте (First Year of Address).
5) Последний год в указанном месте (Last Year of Address).
6) Источник сведений (Address Source) – Указывается источник сведений, из которого почерпнута информация о связи данной персоналии с данным местом.
7) Примечания (Address Notes).
3.3. Поступление на службу
Следующий блок посвящен процедуре, которую прошел человек для получения того или иного формального статуса. Как отмечается в [5; 18], в большинстве случаев здесь содержатся указания на начало правительственной карьеры, но в то же время CBDB уже начала отслеживать и другие пути социального развития, например, посвящение в монахи. Содержание блока представлено в Таблице 3.
Таблица 3.
Блок информации о вступлении в должность в CBDB (на примере Чжу Си)
# |
Entry Category |
Specific Mode |
Year of Entry |
Age at Entry |
考試 科目 |
Entry Source |
Entry Notes |
1 . |
|
examination: jinshi (regular)科舉: 正奏名進士 |
1148 |
19 |
|
紹興十八年同年小錄Shaoxing shiba nian tongnian xiaolu |
|
Как видно из Таблицы 3, данный блок включает 7 позиций:
1) Тип вступления в должность (Entry Category) – Выяснить содержание данной позиции не удалось. Возможно, предполагалось здесь отдельно указывать «Тип вступления», который в настоящее время отражается вместе со «Способом» – см. следующий пункт.
2) Конкретный способ (Specific Mode) – Фактически включает два вида сведений: конкретный способ вступления в должность (все возможные способы, охватываемые базой данных, перечислены в таблице ENTRY_CODES в локальной версии) и тип вступления, к которому данный способ относится (перечислены в таблице ENTRY_TYPES). Иначе говоря, «Тип вступления» – это более общая категория, включающая в себя различные методы.
В примере с Чжу Си «Тип вступления» – это «экзамен» (examination), а способ – «экзамен на степень цзиньши (регулярный)» (jinshi regular).
3) Год вступления (Year of Entry)
4) Возраст при вступлении (Age at Entry)
5) Тема экзамена
6) Источник сведений о вступлении в должность (Entry Source)
7) Примечания по вступлению в должность (Entry Notes)
3.4. Должность
Следующий блок содержит информацию о должностях, которые занимала историческая персоналия [5;18–19]. Содержание блока показано в Таблице 4.
Таблица 4.
Блок информации о должностях Чжу Си (показана 1 запись из 32)
# |
Office Title |
Office Address |
Fisrt year in Office |
Last year in Office |
Appointment Type |
Appointment Fullfilled |
Office Source |
Office Notes |
1 . |
zhi mou jun shi(知某軍事) |
宋朝--江南東路--南康軍(Nankang Jun) |
南宋淳熙6年 |
南宋淳熙8年 |
正授 |
|
宋人傳記資料索引(電子版)Song ren zhuan ji zi liao suo yin (dian zi ban)Index to Song Biographical Materials (頁:4269) |
|
Как видно из Таблицы 4, данный блок включает 8 позиций:
1) Название должности (Office Title) – Полный перечень всех должностей, отраженных в CBDB, находится в таблице OFFICE_CODES в локальной версии. В этой же таблице можно почерпнуть альтернативные названия должности и предлагаемый перевод на английский.
Например, первая должность Чжу Си zhi mou jun shi(知某軍事) (идентификационный номер 124) переводится как «администратор армии» Administrator of an Army(Hucker) и имеет альтернативные названия zhi jun; zhuan cheng; shi jun; jun jiang; mu; ming gong; you tu zhi guan; jun tai shou; jun shou.
2) Местонахождение должности (Office Address).
3) Первый год в должности (First Year in Office).
4) Последний год в должности (Last Year in Office).
5) Тип назначения (Appointment Type). Все возможные в CBDB варианты назначений приведены в таблице APPOINTMENT_TYPE_CODES в локальной версии. В примере с Чжу Си 正授 – это «назначение по обычной процедуре» (Regular Appointment).
6) Выполнение назначения (Appointment Fulfilled) – Значение данной позиции выяснить не удалось.
7) Источник сведений о пребывании должности (Office Source).
8) Пояснения по должности (Office Notes).
3.5. Социальный статус
Помимо официальных должностей, историческое лицо могло быть известно в обществе и в других качествах, которые не закреплялись каким-либо формальным образом. Отражению именно этой информации посвящен данный блок в CBDB [5, с. 17]. Структура данного блока показана в Таблице 5.
Таблица 5.
Блок информации о социальных статусах (на примере Чжу Си; показано 2 записи из 5)
# |
Social Distinctiveness |
補充文字 |
First year of Distinctiveness |
Last year of Distinctiveness |
1 . |
civil office[為官者:文] |
|
|
|
2 . |
teacher: military教師:軍事教官 |
|
|
|
Как видно из Таблицы 5, данный блок включает 4 позиции:
1) Социальный статус (Social Distinctiveness). Все возможные варианты социального статуса, отраженные в CBDB, можно найти в таблице STATUS_CODES в локальной версии базы данных.
2) Дополнительный текст.
3) Первый год пребывания в статусе (First Year of Distinctiveness).
4) Последний год пребывания в статусе (Last Year of Distinctiveness).
3.6. Родственники
Следующий блок раскрывает информацию о родственниках исторического лица [5, с.13–14], как показано в Таблице 6.
Таблица 6.
Блок информации о родственниках (на примере Чжу Си; показано 2 записи из 25)
# |
Kin Type |
Kin Name |
1 . |
長子; 第一子S1 |
Zhu Shu朱塾 |
2 . |
母M |
Zhu Shi祝氏(朱熹母) |
Как видно из Таблицы 6, данный блок включает 2 позиции:
1) Тип родственной связи (Kin Type). Все охваченные в CBDB типы родственных связей можно найти в таблице KINSHIP_CODES в локальной версии базы данных. Однако необходимо отметить, что в данной таблице только китайские названия приведены полностью, тогда как для английских использованы сокращения. Эти сокращения можно видеть в примере с Чжу Си: так, под номером 1 в списке его родственников идет
長子; 第一子S1. Расшифровка этих сокращений дается в [5, с.13–14], откуда, в частности, можно узнать, что под «S1» подразумевается «первый сын».
2) Имя родственника (Kin Name)
3.7. Взаимосвязанные персоналии
Данный блок охватывает связи между людьми, не обусловленные родством (хотя и не исключает родства) [5, с.14-16]. Пример Чжу Си показывает, что к таким взаимосвязанным лицам могут относиться друзья, ученики, корреспонденты по переписке, авторы предисловий или послесловий к сочинениям исторического лица.
Помимо самих по себе взаимосвязанных лиц, данный блок также включает информацию о родственниках этих взаимосвязанных лиц, что, с одной стороны, усложняет его структуру, но с другой стороны, открывает более широкие возможности для проведения исследований взаимосвязей между историческими лицами.
Структура данного блока представлена в Таблице 7.
Таблица 7.
Блок информации о взаимосвязанных персоналиях (на примере Чжу Си; показано 2 записи из 2566)
# |
Type Of Social Association |
Associate |
Type of Kinship Relation |
Kin |
Kinship Type for Associates Kin |
Kin of the Associate |
Date of Assocation |
1. |
[Undefined]未詳 |
|
B+兄 |
Wang Anshi王安石 |
G-n直系祖先 |
Wang Anshi王安石 |
西漢建元 |
2. |
Friend of友 |
Yan Du顏度 |
U未詳 |
|
U未詳 |
|
1179 |
Как видно из рисунка, данный блок включает 7 позиций:
1) Тип социальной взаимосвязи (Type of Social Association) – взаимосвязь исторического лица с взаимосвязанным лицами. Все охваченные в CBDB виды такой взаимосвязи приведены в таблице ASSOC_CODES в локальной базе данных.
2) Взаимосвязанное лицо (Associate) – Имя взаимосвязанного лица
3) Тип родственной связи (Type of Kinship Relation) – Тип родственной связи (см. первый пункт в разделе 3.6. выше), если связь с взаимосвязанным лицом была установлена через родственника исторического лица.
4) Родственник (Kin) – Имя родственника исторического лица, через которого была установлена взаимосвязь.
5) Тип родства с родственником взаимосвязанного лица (Kinship Type of Associates Kin) – Тип родственной связи, если связь с взаимосвязанным лицом была установлена через родственника взаимосвязанного лица.
6) Родственник взаимосвязанного лица (Kin of the Associate) – имя родственника взаимосвязанного лица, через которого была установлена взаимосвязь.
7) Дата взаимосвязи (Date of Association).
В случае с Чжу Си имеется интересный пример: первая из возвращенных поисковым интерфейсом записей говорит о том, что существовало некое лицо (мы не знаем его имя – пустая графа «Взаимосвязанное лицо» и не знаем, как именно он был связан с Чжу Си – пустая графа «Тип социальной взаимосвязи»), которое было потомком в неизвестном числе поколений (G-n) Ван Аньши и с которым Чжу Си был связан через своего старшего брата (B+).
3.8. Тексты
В данном блоке представлены литературные произведения, над которыми в той или иной роли работало историческое лицо [5, с.22–23].
Структура данного блока показана в Таблице 8.
Таблица 8.
Блок информации о текстах исторического лица (на примере Чжу Си; показано 2 записи из 30)
# |
Title |
Role of Writing |
Year of Publication |
Author's Period |
著述出處 |
1 . |
朱子文集 Zhuzi wenji |
|
1200 |
1130-1200 |
|
2 . |
晦庵先生朱文公文集 Huian xiansheng Zhu wengong wenji |
|
1200 |
1130-1200 |
|
Как видно из Таблицы 8, данный блок включает 5 позиций:
1) Название сочинения (Title)
2) Роль исторического лица в отношении данного текста (Role of Writing). Полный перечень доступен в таблице TEXT_ROLE_CODES в локальной версии базы данных. Например, роль может определяться как «автор», «издатель», «составитель», «издатель» и др.
3) Год публикации (Year of Publication)
4) Годы жизни автора (Author’s Period)
5) Источник текста
Выводы
Как показало исследование, China Biographical Database (CBDB) представляет собой крупную базу данных со сложной структурой. С одной стороны, это открывает значительные возможности для исторических исследований, но с другой – требует определенной подготовки в плане изучения информационных позиций, доступных в рамках этой базы данных.
Для работы с CBDB можно использовать как онлайн поисковый интерфейс, так и находящуюся в открытом доступе для скачивания версию базы данных для локального компьютера.
На данный момент CBDB включает в себя записи по 370 тысячам историческим персоналиям за период с VII по XIX вв. Информация по каждой персоналии подразделяется на 8 основных блоков.
Изучение информационных позиций, входящих в каждый из 8 блоков, показало, что названия позиций не всегда дают полное представление об их содержании. С помощью CBDB User Guide смысл каждой позиции был четко раскрыт. Кроме того, некоторые позиции, такие как «Способ поступления на службу» или «Социальный статус», могут принимать лишь определенный набор значений, который задан в базе данных изначально. На примере одной персоналии невозможно показать все возможные варианты значений, поэтому для понимания этих рубрик были даны отсылки к базовым таблицам в локальной версии CBDB, где можно ознакомиться с полными перечнями.
В заключение можно отметить, что CBDB представляет собой мощный инструмент для проведения исследований по историческим персоналиям Китая, а потому заслуживает дальнейшего изучения.