Статья:

Сравнительный анализ возможностей дополнительных методов поиска в базе данных по историческим персоналиям Китая China Biographical Database

Конференция: VIII Международная заочная научно-практическая конференция «Научный форум: юриспруденция, история, социология, политология и философия»

Секция: Всеобщая история

Выходные данные
Лепнева М.Л. Сравнительный анализ возможностей дополнительных методов поиска в базе данных по историческим персоналиям Китая China Biographical Database // Научный форум: Юриспруденция, история, социология, политология и философия: сб. ст. по материалам VIII междунар. науч.-практ. конф. — № 6(8). — М., Изд. «МЦНО», 2017. — С. 7-24.
Конференция завершена
Мне нравится
на печатьскачать .pdfподелиться

Сравнительный анализ возможностей дополнительных методов поиска в базе данных по историческим персоналиям Китая China Biographical Database

Лепнева Мария Леонидовна
аспирант, Бурятский государственный университет, РФ, г. Улан-Удэ

 

Comparative analysis of additional search methods for data on historical persons in China within the China Biographical Database

 

Mariia Lepneva

post-graduate student, Buryat State University, Russia, Ulan-Ude

 

Аннотация. Цель данной работы состоит в проведении сравнительного анализа методов поиска данных по историческим персоналиям Китая в базе данных China Biographical Database (CBDB). Проверяется гипотеза о том, что наиболее перспективным для применения является «продвинутый поиск». Исследование показало, что методы «поиск по месту» и «поиск по должности» с точки зрения доступных в них критериев полностью дублируются в «продвинутом поиске». В то же время «поиск по ключевому слову» и «поиск родственных и социальных взаимосвязей» дают дополнительные возможности по сравнению с продвинутым поиском.

Abstract. The purpose of this paper is to conduct a comparative analysis on search methods for data on historical persons of China within the China Biographical Database (CBDB). The hypothesis to be verified is that the Advanced Search is the most powerful method within the database. The research has shown that two methods – Search by Address and Search by Office – fully duplicate the criteria available within Advanced Search. By contrast, Keyword Search as well as Kinship and Social Associations Search provide unique additional opportunities in comparison to Advanced Search.

 

Ключевые слова: China Biographical Database; CBDB; база данных; методы поиска; история; Китай; исторические персоналии.

Keywords: China Biographical Database; CBDB; database; search methods; history; China; historical persons.

 

 

Введение

Актуальность использования онлайн баз данных для проведения исследования истории Китая определяется тем, что такие базы данных позволяют в структурированном виде аккумулировать большой объем сведений из многочисленных исторических источников, и поисковый интерфейс таких баз данных позволяет легко получить доступ к нужным данным в соответствии с заданными критериями.

В то же время для успешного использования таких баз данных необходимо прежде всего четко представлять, какую информацию они включают. Без этого невозможно определить, какие вопросы, возникающие в рамках исторического исследования, можно, а какие нельзя решить с помощью конкретной базы данных.

В связи с вышесказанным в предшествующей работе [1] автором была рассмотрена структура данных в крупной базе по историческим персоналиям Китая – China Biographical Database (CBDB), которая на апрель 2017 г. включает статьи примерно по 370 тысячам персоналий за период с VII по XIX вв. База данных находится в открытом доступе и предназначается для статистических исследований, исследований социальных взаимосвязей, пространственного анализа, а также может быть использована как биографический справочник. На официальном сайте CBDB приводится несколько примеров исследований [2; 3; 4; 5], выполненных с использованием этой базы данных. Подробнее о CBDB – см. [1, с.8].

В свете предшествующего исследования очевидно, что CBDB может использоваться как биографический справочник. Иначе говоря, желая получить более подробную информацию о конкретной исторической персоналии, можно провести поиск по имени – возможно, с некоторой дополнительной конкретизацией, например, по династическому периоду, как показано предшествующей работе автора на примере Чжу Си [1, с. 9]. Подобный поиск полностью аналогичен поиску статьи в словаре или справочнике.

Вместе с тем, особенности внутренней структуры и поискового интерфейса исследуемой базы данных дают возможность ставить целый ряд других вопросов, помимо получения информации о конкретной исторической персоналии. Новизна данной работы заключается в том, чтобы показать эти расширенные возможности работы с China Biographical Database.

Объектом данной работы является база данных по историческим персоналиям Китая China Biographical Database (CBDB), а предметом исследования – доступные в её рамках методы поиска данных.

Цель работы состоит в рассмотрении дополнительных к поиску по имени методов поиска данных, предлагаемых интерфейсом CBDB. Для достижения цели предполагается выполнить следующие задачи:

1.  охарактеризовать техническую основу дополнительных методов поиска данных в CBDB;

2.  рассмотреть критерии поиска данных в различных дополнительных методах в CBDB;

3.  провести сравнительный анализ дополнительных методов поиска данных с точки зрения критериев поиска;

4.  на основе проведённого сравнения определить предпочтительные методы в поисковом интерфейсе CBDB для применения в дальнейших исследованиях исторических персоналий Китая.

На основе предварительного изучения методов поиска в CBDB была сформулирована гипотеза данной работы. Она состоит в том, что метод «Продвинутый поиск» в CBDB как создающий возможность одновременного поиска как по одному, так и по множеству критериев, включает в себя возможности прочих дополнительных методов поиска в этой базе данных, а потому является наиболее перспективным для применения.

Используемый для исследования интерфейс базы данных расположен по адресу (английская версия):

http://db1.ihp.sinica.edu.tw/cbdbc/ttsweb?@0:0:1:cbdbkmeng@@0.8781806794043143

Китайская версия того же интерфейса расположена по адресу:

http://db1.ihp.sinica.edu.tw/cbdbc/ttsweb?@0:0:1:cbdbkm@@0.3264195112188333

Версия базы данных для скачивания на локальный компьютер доступна на странице:

https://projects.iq.harvard.edu/cbdb/download-cbdb-standalone-database

Официальный сайт проекта расположен по адресу:

https://projects.iq.harvard.edu/cbdb

1.  Технические истоки дополнительных видов поиска в China Biographical Database и их предварительная классификация

В рамках предшествующего исследования автора по структуре данных в CBDB применялся наиболее базовый вид поиска, предоставляемый интерфейсом этой базы данных – поиск по имени (Search by Name) [1, с.8]. С учётом цели и задач работы это было оправдано, поскольку информация в базе данных структурируется по конкретной персоналии. Иными словами, в данной базе имя персоналии является объектом (feature), а различные характеристики (географические локации, должности, родственники и т.п.) – его атрибутами (attributes, fields).

Поиск по имени – это фактически поиск по объекту, результатом которого является получение всех атрибутов данного объекта. Но в то же время при такой структуре данных совершенно естественным является поиск по атрибуту, результатом которого является получение некоторого числа объектов, у которых данный атрибут принимает одинаковое значение (с полным или частичным совпадением).

Действительно, в CBDB предоставлен ряд возможностей осуществления поиска по атрибуту. Как показано на Рисунке 1, они включают:

1.  Поиск по месту (Search by Address)

2.  Поиск по должности (Search by Office)

3.  Поиск по ключевому слову (Keyword Search)

4.  Продвинутый поиск (Advanced Search)

5.  Родственные и социальные связи (Kinship and Social Associations)

 

Рисунок 1. Методы поиска в CBDB

 

Предварительное рассмотрение вышеуказанных видов поиска позволило разделить их на две группы в зависимости от сложности критериев поиска.

К базовым видам поиска по атрибутам в CBDB можно отнести те виды поиска, в которых в качестве главного критерия выступает один атрибут (или тематически единая группа атрибутов), который может быть дополнен ограничениями по небольшому числу других критериев (как правило, хронологическим или географическим).

Сюда могут быть отнесены: поиск по месту, поиск по должности, поиск по ключевому слову, родственные и социальные связи.

К усложнённым видам поиска можно отнести продвинутый поиск, поскольку он даёт возможность одновременного использования целого ряда критериев.

Далее каждый из видов поиска будет рассмотрен подробнее.

2.  Базовые виды поиска по атрибутам в CBDB

2.1. Поиск по месту (Search by Address)

Поиск по месту (Search by Address) включает следующие критерии:

· Место (Address).

· Тип места (Type of Address).

· Период лет указателя (Index Years) – позволяет указать интервал с какого-то года по какой-то год. Поиск отбирает тех персоналий, у которых «Год указателя (Index Year)» попадает в указанный интервал.

· Династический период (Dynastic Period).

Можно отметить некоторую непоследовательность в терминологии CDBD: так, здесь «Место (Address)» фактически соответствует атрибуту «Название места (Address Location)» в структуре данных по конкретной исторической персоналии (которая была рассмотрена в предшествующей работе автора), а «Династический период (Dynastic Period)» – атрибуту «Династия (Dynasty)». Хотя интуитивно сопоставить эти пары достаточно легко, однако с точки зрения единства терминологии наилучшим вариантом, конечно же, была бы унификация.

Подробнее о значении, которое может принимать каждый из вышеуказанных атрибутов, – см. [1, с. 11, 13].

Таким образом, в поиске по месту главным критерием является географический с возможностью дополнительных хронологических ограничений.

 

2.2. Поиск по должности (Search by Office)

Поиск по должности (Search by Office) включает следующие критерии:

· Династический период (Dynastic Period).

· Название должности (Office Title).

· Способ вступления в должность (Mode of Entry into Office).

· Период пребывания в должности (Years in Office) – позволяет указать интервал с какого-то года по какой-то год. Поиск осуществляется на основе атрибутов «Первый год в должности (First Year in Office)» и «Последний год в должности (Last Year in Office)» в структуре данных по конкретной исторической персоналии.

· Географическое положение (Location).

В данном случае снова имеет место некоторая терминологическая непоследовательность CBDB. Выше уже отмечено, что «Династический период (Dynastic Period)» соответствует атрибуту «Династия (Dynasty)» в структуре данных по конкретной исторической персоналии. Кроме того, «Способ вступления в должность (Mode of Entry into Office)» соответствует «Конкретному способу (Specific Mode)», а «Географическое положение (Location)» – «Местонахождению должности (Office Address)».

Подробнее о значении, которое может принимать каждый из вышеуказанных атрибутов, – см. [1, с. 14–15].

В данной категории поиска основные критерии связаны с должностью, а хронологический и географический критерий являются вспомогательными. С учётом этого остаётся неясным, почему в качестве первого критерия в интерфейсе поставлен «Династический период (Dynastic Period)», ведь его было бы наиболее логично расположить ниже, перед вторым хронологическим критерием «Период пребывания в должности (Years in Office)».

2.3. Родственные и социальные связи (Kinship and Social Associations)

Поисковая вкладка «Родственные и социальные связи (Kinship and Social Associations)» делится на два раздела «Родство» (Kinship) и «Социальная(ые) взаимосвязь(и)» (Social relation(s)) и включают следующие критерии поиска:

· Родство (Kinship):

Типы родственной связи (type(s) of kinship relation)

Взаимосвязанные лица (Associates)

· Социальная(ые) взаимосвязь(и) (Social relation(s)):

Социальная(ые) взаимосвязь(и) (social relation(s))

Взаимосвязанное(ые) лицо(а) (associate(s))

Как и в рассмотренных выше частях поискового интерфейса CBDB, здесь имеет место терминологическая несогласованность: «Типы родственной связи (type(s) of kinship relation)» здесь соответствуют «Типам родственной связи (Kin Type)» в структуре данных по конкретной исторической персоналии, а «Взаимосвязанные лица (Associates)» (в разделе «Родство (Kinship)») на самом деле подразумевают поиск по имени родственника, т.е. по атрибуту «Имя родственника (Kin Name)» в структуре данных по конкретной исторической персоналии. Термин «Взаимосвязанные лица (Associates)» здесь использован тем более неудачно, что этим же термином обозначены взаимосвязанные через иные, нежели родство, социальные взаимоотношения лица.

Кроме того, критерий «Социальная(ые) взаимосвязь(и) (Social relation(s))» соответствуют «Типу социальной взаимосвязи (Type of Social Association)» в структуре данных по конкретной исторической персоналии.

Подробнее о значении, которое может принимать каждый из вышеуказанных атрибутов – см. [1, с. 16–18].

2.4. Поиск по ключевому слову (Keyword Search)

Поиск по ключевому слову (Keyword Search) включает следующие критерии:

· Ключевые слова (Keywords) – поле для пользовательского ввода.

· Типы атрибутов данных (Types of Data Field):

1)  Биографические данные (Biographical Data) – раздел соответствует тому специально не озаглавленному блоку информации в структуре данных по конкретной исторической персоналии, который в предшествующей работе автора был условно назван «Общие сведения» [1, с.9]. Для проверки того, какие критерии охватывает данный раздел, были использованы данные по Чжу Си из моей предшествующей работы [1, с.10-11]. Как показала проверка, раздел «Биографические данные» производит поиск по критериям Дата рождения (Date of Birth), Дата смерти (Date of Death), Другие имена (Alternative names), Базовое местоположение (Basic Affiliation), Происхождение предков (Choronym). Интересно, что если ввести имя исторической персоналии, то поиск будет производиться не по объекту, а по всем атрибутам. Так, например, при вводе имени Чжу Си в результатах поиска будет, например, некий Bao Yang包揚, для которого Чжу Си является взаимосвязанным лицом в рамках социальных взаимосвязей.

2)  Место (Address)

3)  Сочинения (Writings)

4)  Должность (Office)

5)  Вступление (Entry)

6)  Социальный статус (Social Distinction)

7)  Родственная связь (Kinship Relation)

8)  Социальная взаимосвязь (Social Association)

9)  Социальный институт (Social Institution) – см. ниже

·     Год указателя (Index Year)

·     Период пребывания в должности (Years in Office) – см. пункт 2.2 выше

Как и в предшествующих разделах, отсутствие терминологического единства в CBDB потребовало дополнительного установления соответствия между названиями критериев в данном виде поиска и разделами в структуре данных по конкретной исторической персоналии, а именно: «Сочинения (Writings)» здесь соответствует «Названию сочинения (Title)», «Должность (Office)» – «Названию должности (Office Title)», «Вступление (Entry)» – «Конкретному способу (Specific Mode)», «Социальный статус (Social Distinction)» – «Социальному статусу (Social Distinctiveness)», «Родственная связь (Kinship Relation)» – «Типам родственной связи (Kin Type)», «Социальная взаимосвязь (Social Association)» – «Типу социальной взаимосвязи (Type of Social Association)».

Поиск по ключевому слову – это фактически также разновидность поиска по одному атрибуту, причём он включает в себя возможность поиска по уже охваченному в предшествующих разделах местонахождению, должности и способу вступления в должность, типу родственных и социальных взаимосвязей. Однако в отличие от уже рассмотренных выше методов поиска, здесь пользовательский ввод значения атрибута осуществляется не путём выбора из исчерпывающего списка всех возможных вариантов, а через произвольный ввод с клавиатуры.

Применение ввода с клавиатуры, а значит – поиска по ключевому слову, предполагает, что пользователь знает или хотя бы предполагает, какое значение может принимать выбранный им атрибут в таблице. Однако такое предположение далеко не всегда может сформировать результативный поиск. Так, например, зная, что «буддийский монах» в самом общем смысле по-китайски может переводиться как «хэшан» 和尚 или «сэнжэнь» 僧人, пользователь получит нулевой результат поиска по данному ключевому запросу в разделе Social Distinction, т.к. в CBDB английскому Buddhist monk по непонятным причинном соответствует более узкий термин «бхикшу» 比丘, на самом деле обозначающий только монахов, принявших полный обет.

Если подпункты 2) и 4)-8) среди атрибутов данных, которые могут выступать критериями в данном виде поиска, фактически дублируют возможности описанных выше видов поиска в CBDB (см. пункты 2.1–2.3), то подпункты 1), 3) и 9) являются новыми, а потому наиболее интересными возможностями в рамках метода поиска по ключевому слову.

Что касается подпункта 1) «Биографические сведения», с учётом того, что альтернативные имена, например, могут принимать весьма многообразные значения или требовать поиска по частичному совпадению значения, применение поиска по ключевому слову в значительной степени оправдано.

Что касается подпункта 3) «Сочинения», возможность поиска литературных сочинений, в названии которых фигурирует интересующее слово, является неоспоримым преимуществом поиска по ключевому слову. Так, например, если необходимо выявить всех исторических персоналий в рамках CBDB, которые писали о буддийских ритуалах покаяния, можно предположить, что в названиях соответствующих сочинений будет фигурировать слово «покаяние» 懺 (chàn). Результаты поиска по ключевому слову показаны на Рисунках 2 и 3.

 

Рисунок 2. Поисковый запрос по иероглифу «покаяние» (chàn) на полное или частичное совпадение в атрибуте «Сочинения» в CBDB

 

Рисунок 3. Результаты поиска авторов сочинений о буддийских ритуалах покаяния с помощью метода поиска по ключевому слову в CBDB

 

Как видно из Рисунка 3, в рамках China Biographical Database имеется информация о пяти исторических персоналиях, в чьих сочинениях фигурирует иероглиф «покаяние». Узнать конкретные названия данных сочинений можно в просмотре информации по каждой персоналии по отдельности путём нажатия на её имя. Например, у первого в списке Shi Zunshi釋遵式 имеется сочинение 淨土法金光明觀音諸本儀 («Ритуал покаяния по множеству книг Гуаньинь по [Сутре] золотого света [в рамках] методов покаяния [школы] Чистой земли»), как показано на Рисунке 4 синим прямоугольником.

 

Рисунок 4. Просмотр названия конкретного сочинения в данных по конкретной исторической персоналии после поиска по ключевому слову в CBDB

 

Что касается подпункта 9) Социальный институт (Social Institution), его рассмотрение заслуживает отдельного внимания, т.к. он относится к блоку информации, который не был выявлен в рамках предшествующей работы автора по структуре данных по историческим персоналиям в China Biographical Database.

Данный блок раскрывает информацию о местах, где историческое лицо выступало в той или иной социальной роли [6, с.22, 24-25], как показано в Таблице 1.

Таблица 1.

Блок информации о социальном институте (на примере Ши Дасиня – Shi Daxin釋大訢)

#

Institution Name

Institution Address

Role at Institution

Dynasty

Institution

Source

Institution

Notes

 1 .

大龍翔集慶寺Dalongxiangjiqingsi

集慶路-江浙行中書省-元朝

cleric at任:佛僧/道士於

 

 

 

 2 .

報國寺Baoguosi

杭州路-江浙行中書省-元朝

cleric at任:佛僧/道士於

 

 

 

 3 .

烏囘寺Wuhuisi

開州-大名府-直隸省-清朝

cleric at任:佛僧/道士於

 

 

 

 

Как видно из Таблицы 1, данный блок включает 6 позиций:

1)  Название института (Institution Name) – Полный перечень всех названий социальных институтов можно найти в базовой таблице SOCIAL_INSTITUTION_NAME_CODES в локальной версии CBDB (20170310CBDBauBase). Кроме того, как следует из таблицы SOCIAL_INSTITUTION_TYPES, все социальные институты CBDB входят в три группы: академии, буддийские монастыри или даосские монастыри.

2)  Местонахождение института (Institution Address)

3)  Роль в институте (Role at Institution) – Полный перечень всех типов взаимосвязи между исторической персоналией и социальным институтом приведён в таблице ПBIOG_INST_DATA в локальной версии CBDB.

4)  Династия (Dynasty)

5)  Источник по институту (Institution Source)

6)  Примечание по институту (Institution Notes)

 

2.5. Продвинутый поиск (Advanced Search)

Продвинутый поиск (Advanced Search) в отличие от ранее рассмотренных видов поиска позволяет одновременно задавать как один, так и множество критериев из различных сфер. В целях проверки гипотезы данной работы производится сравнение критериев поиска, предлагаемых в рамках метода «продвинутый поиск» с критериями поиска, доступными в рассмотренных выше иных дополнительных методах поиска в CBDB, как показано в Таблице 2.

Таблица 2.

Сравнительный анализ возможностей дополнительных видов поиска в China Biographical Database

Продвинутый поиск (Advanced Search)

Поиск по месту (Search by Address)

Поиск по должности (Search by Office)

Родственные и социальные связи (Kinship and Social Associations)

Поиск по ключевому слову (Keyword Search)

Имя (Name)

 

 

 

Биографические данные (Biographical Data)

Год указателя (Index Year)

Период лет указателя (Index Years)

 

 

Год указателя (Index Year)

Год рождения (Year of Birth)

 

 

 

Биографические данные (Biographical Data)

Год смерти (Year of Death)

 

 

 

Биографические данные (Biographical Data)

Происхождение предков (Choronym)

 

 

 

Биографические данные (Biographical Data)

Династический период (Dynastic Period)

Династический период (Dynastic Period)

Династический период (Dynastic Period)

 

 

Этнос/Племя (Ethnicity/Tribe)

 

 

 

 

Пол (Gender)

 

 

 

Биографические данные (Biographical Data)

Тип места (Type of Address)

Тип места (Type of Address)

 

 

 

Место (Address)

Место (Address)

 

 

Место (Address)

Название должности (Office Title)

 

Название должности (Office Title)

 

Должность (Office)

Период пребывания в должности (Years in Office)

 

Период пребывания в должности (Years in Office)

 

Период пребывания в должности (Years in Office)

Тип назначения (Type of Appointment)

 

 

 

 

Класс должности (Class of Office)

 

 

 

 

Географическое положение (Location)

 

Географическое положение (Location)

 

 

Способ вступления в должность (Mode of Entering Office)

 

Способ вступления в должность (Mode of Entry into Office)

 

Вступление (Entry)

Год вступления в должность (Year of Entry)

 

 

 

 

Название социального института (Name of Social Institution)

 

 

 

Социальный институт (Social Institution)

Роль социального института (Role of Social Institution)

 

 

 

 

Социальный статус (Social Distinction)

 

 

 

Социальный статус (Social Distinction)

Жанр сочинения (Genre of Writing)

 

 

 

 

Роль исторического лица в отношении данного текста (Role of Writing)

 

 

 

 

 

 

 

Типы родственной связи (type(s) of kinship relation)

Родственная связь (Kinship Relation)

 

 

 

Взаимосвязанные лица (Associates)

 

 

 

 

Социальная(ые) взаимосвязь(и) (social relation(s))

Социальная взаимосвязь (Social Association)

 

 

 

Взаимосвязанное(ые) лицо(а) (associate(s))

 

 

 

 

 

Сочинения (Writings)

 

 

 

 

Другие имена (Alternative Names) – в рамках раздела «Биографические данные (Biographical Data)»

 

Как видно из Таблицы 2, продвинутый поиск охватывает абсолютно все критерии поиска из поиска по месту и поиска по должности. Частично его критерии пересекаются с критериями поиска по ключевому слову. В то же время поиск родственных и социальных связей является полностью дополняющим по отношению к продвинутому поиску.

Кроме того, продвинутый поиск содержит некоторые собственные критерии, не отражённые в других видах поиска:

• Этнос/Племя (Ethnicity/Tribe) – в поисковом интерфейсе нажатие на этот раздел выдаёт ошибку, в силу чего невозможно было установить содержание данного критерия. Критерий с подобным названием отсутствует и в структуре данных по конкретной исторической персоналии. Однако среди базовых таблиц в локальной версии базы данных присутствует таблица под названием ETHNICITY_TRIBE_CODES.

• Тип назначения (Type of Appointment) – см. «Тип назначения (Appointment Type)» в [1, с.15]

• Класс должности (Class of Office) – нажатие на этот раздел выводит перечень характеристик должности, который находится в базовой таблице OFFICE_CATEGORIES в локальной версии CBDB. Однако установить его место в структуре данных по конкретной исторической персоналии и взаимосвязь с другими критериями не удалось. Для проверки был проведён продвинутый поиск по одному из значений данного критерия «Salary rank寄祿官», который выдал 2938 результатов. Однако после открытия данных по конкретной персоналии, входящей в этот список, например, по Zha Yue查籥, ни в одном из выведенных блоков информации по нему значения «Salary rank寄祿官» не было обнаружено.

· Год вступления в должность (Year of Entry) – см. «Первый год в должности (First Year in Office)» [1, с.15]

· Роль социального института (Role of Social Institution) – в поисковом интерфейсе нажатие на этот раздел выдаёт ошибку, в силу чего невозможно было установить содержание данного критерия. Возможно, он должен соответствовать критерию «Роль в институте (Role at Institution)» (см. п. 2.4 выше).

· Жанр сочинения (Genre of Writing) – в поисковом интерфейсе нажатие на этот раздел выдаёт возможный список жанров с несколькими уровнями подкатегорий (см. Рисунок 5). Однако проведение поиска по ним не даёт результатов, что позволяет предположить, что раздел находится в разработке. В то же время в локальной версии CBDB имеется таблица TEXT_BIBLCAT_TYPES, которая соответствует первому и второму уровням списка жанров в поисковом интерфейсе (например, в неё входят значения «Master 子部» и «Religion宗教類»), и таблица TEXT_BIBLCAT_CODES, соответствующая третьему уровню списка (например, в неё входит значение «Buddhists佛教/釋氏»). В CBDB User Guide упоминается, что в базе данных должна присутствовать таблица GENRE_CODE_TYPE_REL [6, с.27], определяющая связь между вторым и третьим уровнями списка, однако фактически в локальной версии её нет. Значения четвёртого уровня списка, т.е. названия конкретных сочинений (например, 宋高僧傳 Song gaoseng zhuan), входят в таблицу TEXT_CODES, которая одновременно устанавливает связь со значениями третьего уровня.

 

Рисунок 5. Выбор жанра сочинения в рамках продвинутого поиска

 

Роль исторического лица в отношении данного текста (Role of Writing) – см. [1, с.18–19].

Выводы

Проведённое исследование частично подтвердило выдвинутую гипотезу и показало фактическую неравноценность различных видов дополнительного поиска (поиска по атрибутам) в China Biorgaphical Database. Фактически такие виды поиска, как поиск по месту и поиск по должности, не имеют самостоятельной ценности, т.к. все доступные в них критерии присутствуют также в продвинутом поиске, который при этом охватывает и ряд дополнительных критериев.

В то же время полностью самостоятельным значением обладает поиск родственных и социальных связей, т.к. доступные в нём критерии не дублируются иными видами поиска в CBDB. Особую ценность имеет поиск по ключевому слову как с точки зрения удобства (позволяет вручную вводить нужное значение атрибута без необходимости поиска по многоуровневым спискам), так и с точки зрения доступных критериев поиска (например, есть возможность искать литературные сочинения по встречающемуся в них слову, т.е. даже по частичному совпадению).

В ходе исследования была выявлена систематическая непоследовательность China Biographical Database в использовании терминологии. В поисковом интерфейсе названия критериев поиска могут в большей или меньшей степени отличаться от названий разделов в структуре данных по конкретной исторической персоналии, рассмотренных автором в предшествующем исследовании [1]. Наиболее неудачным примером этого является то, что в поиске родственных и социальных связей словом «Взаимосвязанные лица (Associates)» обозначены как родственники, так и собственно взаимосвязанные в силу иных, нежели родство, социальных отношений лица.

Наконец, в процессе исследования был выявлен ещё один блок информации об исторической персоналии, не охваченный автором в предшествующем исследовании, а именно блок информации о социальном институте. Было показано, что в этот блок входят сведения о месте (как правило, научной академии, буддийском или даосском монастыре), к которому имело отношение историческое лицо, и о типе такого отношения.

В целом, исследование показало, что наиболее перспективными дополнительными методами поиска в China Biographical Database являются продвинутый поиск, поиск по ключевому слову и поиск родственных и социальных взаимосвязей, тогда как поиск по месту и поиск по должности являются полностью дублирующими и не имеют самостоятельной ценности.

 

Список литературы:
1. Лепнева М.Л. Структура данных по историческим персоналиям Китая в China Biographical Database // Научный форум: Юриспруденция, история, социология, политология и философия: сб. ст. по материалам VII междунар. науч.-практ. конф. – № 5(7). – М., Изд. «МЦНО», 2017. – С. 6–20.
2. Су Яфэнь, У Явэнь, Ян Чэньжуй, Мао Юаньхэн. Жухэ лиюн CBDB чжаочу «Фэн шу те» цзецзи дэ жэньмай [蘇雅芬、吳雅雯、楊承叡、毛元亨。如何利用CBDB 找出《鳳墅帖》結集的人脈] Как применять CBDB для поиска взаимосвязей, сформировавшихся вокруг «Образца каллиграфии из Поместья Феникса». IV Международная синологическая конференция [第四屆國際漢學會議]. – Центральный исследовательский институт [中央研究院], 20-22.06.2012.
3. Сюй Юнмин. Чжунго гудянь вэньсюэ яньцзю дэ цзичжун кэшихуа туцзин – и Тан Сяньцзу яньцзю вэй ли [徐永明。中国古典文学研究的几种可视化途径——以汤显祖研究为例] Некоторые подходы по визуализации в изучении классической китайской литературы: на примере Тан Сяньцзу. Журнал Чжэцзянского университета (Онлайн издание по гуманитарным и социальным наукам) [浙江大学学报(人文社会科学版)] – 2016(4), С.1–21.
4. Chen Shih-Pei (陳詩沛) The China Biographical Database – Modeling Life Histories – from anecdote to data [ppt]. AAS 2013 – Panel #300 Computational Tools and Digital Resources for Chinese History and Literature. 
5. De Weerdt, Hilde; Hou Ieong Ho. Linking Texts and Databases: Using the CBDB API [ppt]. King’s College London. 
6. Fuller, Michael A. CBDB User Guide. Revised Version 2.0. – February 28, 2015. – 92 p.