Статья:

ОБЗОР ПРОГРАММНЫХ СРЕДСТВ В ОБЛАСТИ АНАЛИЗА ПУБЛИКАЦИОННОЙ АКТИВНОСТИ УЧЁНЫХ

Конференция: XXIII Студенческая международная заочная научно-практическая конференция «Молодежный научный форум: технические и математические науки»

Секция: 3. Информационные технологии

Выходные данные
Крылов И.Б. ОБЗОР ПРОГРАММНЫХ СРЕДСТВ В ОБЛАСТИ АНАЛИЗА ПУБЛИКАЦИОННОЙ АКТИВНОСТИ УЧЁНЫХ // Молодежный научный форум: Технические и математические науки: электр. сб. ст. по мат. XXIII междунар. студ. науч.-практ. конф. № 4(23). URL: https://nauchforum.ru/archive/MNF_tech/4(23).pdf (дата обращения: 19.04.2024)
Лауреаты определены. Конференция завершена
Эта статья набрала 3 голоса
Мне нравится
Дипломы
лауреатов
Сертификаты
участников
Дипломы
лауреатов
Сертификаты
участников
на печатьскачать .pdfподелиться

ОБЗОР ПРОГРАММНЫХ СРЕДСТВ В ОБЛАСТИ АНАЛИЗА ПУБЛИКАЦИОННОЙ АКТИВНОСТИ УЧЁНЫХ

Крылов Иван Борисович
студент группы 14ФИИТ(м)ИС Оренбургского государственного университета, РФ, г. Оренбург
Болдырев Пётр Алексеевич
научный руководитель, канд. техн. наук, заместитель директора по автоматизации библиотечно-библиографических процессов научной библиотеки Оренбургского государственного университета, РФ, г. Оренбург

 

В последние годы в ряде развивающихся стран наблюдается всплеск публикационной активности научного сообщества (Бразилия, Китай, Турция, Иран и другие) [6, с. 15]. В свою очередь, в Российской Федерации на государственном уровне предпринимаются попытки по увеличению доли публикаций российских авторов в общемировом фонде научных публикаций.

Но, несмотря на эти попытки, в различных системах цитирования [1; 2; 7; 8] можно наблюдать различные данные о публикационной активности российских учёных за последние годы. На основе представленных данных проводится анализ и строятся различные прогнозы публикационной активности, среди которых есть как оптимистичные, так и пессимистичные прогнозы. Наряду с оценкой публикационной активности научного сообщества на всероссийском уровне на основе данных, полученных из систем цитирования, возникает необходимость её оценки в рамках каждого высшего учебного заведения в отдельности, в том числе — в Оренбургском государственном университете. Из вышеизложенного следует, что от достоверности, непротиворечивости и полноты представленных данных зависят результаты последующего анализа и прогноза. В данном случае под достоверностью подразумевается принадлежность конкретной публикации или цитирования своему автору, под непротиворечивостью — отсутствие дубликатов публикаций или цитирований, под полнотой — учёт всех возможных работ авторов. Следовательно, аналитический обзор систем цитирования, а также программных средств, предоставляющих дополнительные возможности работы с системами цитирования, с целью получения достоверной, непротиворечивой и полной информации для последующего анализа является актуальной и своевременной задачей.

При детальном рассмотрении систем цитирования [1; 2; 7; 8] были сделаны следующие выводы. Ресурс [2] не отражает полной картины публикационной активности авторов, поскольку не имеет доступа к большому количеству зарубежных публикаций, имеет недочёты при учёте цитирований и не включает большинство работ до 2000 года. Ресурсы [7; 8] не отражают большинство публикаций на русском языке. Ресурс [1] использует данные только из открытых источников и не позволяет сформировать результаты поиска по конкретному автору в удобном для просмотра и анализа формате. Помимо этого, ни один ресурс не учитывает большинство учебных и учебно-методических трудов.

С целью устранения недостатков, присущих системам цитирования, различными учёными предпринимались попытки по созданию программных средств, предоставляющих дополнительные возможности по работе с системами цитирования. К их числу можно отнести следующих учёных: Kiduk Yang, Lokman IMeho, F.MCouto, ABaneyx, PJacsó и других.

В процессе обзора существующих программных средств были выделены 2 группы.

Программные средства первой группы ориентированы на оптимизацию списка публикаций, цитирований, наукометрических показателей из какой-либо одной системы цитирования. К первой группе можно отнести программные средства, рассмотренные в работах [5; 4].

В работе PJacsó [5] описываются эксперименты при расчете индекса Хирша и других наукометрических показателей из Google Scholar с помощью программного средства “Publish or Perish”. Программное средство “Publish or Perish” позволяет пользователю редактировать результирующие списки публикаций, представленные в удобном формате. Это облегчает поиск и устранение дублирующихся записей, предлагая динамическую сортировку по множеству параметров и мгновенный пересчет показателей. Программа генерирует 18 наукометрических показателей из данных, полученных из Google Scholar. “Publish or Perish” имеет множество вариантов и форматов экспорта, в том числе CSV-формат, который широко используется для экспорта и импорта записей из многих электронных таблиц и баз данных. Помимо этого, программа позволяет оценить масштаб ошибок в списке публикаций, предоставленном Google Scholar. Тем не менее, даже после редактирования и совершенствования списков, они не могут быть полностью верны, потому что довольно часто в качестве источников публикаций могут выступать сомнительных ресурсы. Также разработанная программа не показывает различие между основными записями и записями, полученными из списков цитирований. Также могут встречаться несколько одинаковых ссылок на одну и ту же статью. Есть также правильные цитирования, которые ссылаются на отсутствующую в системе публикацию, просто потому, что журнал или выпуск не был обработан, либо публикация была ошибочно пропущена в процессе обработки.

Программные средства второй группы помимо оптимизации списка публикаций и цитирований позволяют агрегировать результаты из нескольких систем цитирования. Ко второй группе можно отнести программные средства, рассмотренные в работах [3; 9].

В работе ABaneyx [3] рассматриваются данные, полученные из Google Scholar и Web of Science. Для поиска соответствующих публикаций использовались программы “Publish or Perish” и “CleanPoP”.

В работе Kiduk Yang [9] проводится исследование по сравнению цитирований, найденных в Scopus, Google Scholar и Web of Science. Представлена программа “CiteSearch”, которая анализирует объединенные данные из нескольких систем цитирования на основе критериев оценки качества.

Отмечено, что более полный анализ цитирований может помочь поддержать или более точно идентифицировать любые расхождения при анализе наукометрических показателей и дать независимую оценку. Архитектура программного средства представлена на рисунке 1.

 

Рисунок 1. Архитектура программного средства CiteSearch

 

CiteSearch позволяет автоматически выполнить следующие действия:

·     проводить поиск как по автору, так и по названию;

·     получать и объединять результаты из обоих видов поиска;

·     удалять повторяющиеся записи;

·     экспортировать результаты в электронную таблицу.

В результате, на основе проведённого анализа систем цитирования и программных средств, предоставляющих дополнительные возможности по работе с системами цитирования, были сделаны следующие выводы:

·     в настоящее время ни одна из существующих баз цитирований в отдельности не даёт полной картины о публикационной активности российских учёных и организаций;

·     при анализе публикационной активности в малой степени используются учебные и учебно-методические публикации авторов, которые в результате могут оказать существенное влияние на наукометрические показатели и последующий анализ публикационной активности;

·     для проведения более полного анализа публикационной активности авторов и организаций могут быть использованы различные программные средства, позволяющие анализировать и агрегировать результаты из различных систем цитирования;

·     на сегодняшний день отсутствуют программные средства, способные анализировать и агрегировать результаты из различных систем цитирования с учётом российского индекса научного цитирования;

·     отсутствует комплексный подход с учётом всех вышеперечисленных составляющих к мониторингу публикационной активности авторов научных организаций России.

Для устранения недостатков, выявленных при рассмотрении систем цитирования и программных средств, предоставляющих дополнительные возможности по работе с системами цитирования, предлагается разработать программную систему, обладающую следующими достоинствами:

·     наличие возможности аккумулировать данные о публикационной активности российских учёных из различных систем цитирования с учётом российского индекса научного цитирования;

·     наличие собственной базы данных организации, включающей учебные и учебно-методические труды;

·     возможность дальнейшего анализа накопленных данных.

 

Список литературы:
1.    Академия Google — [Электронный ресурс]: свободно доступная система полнотекстового поиска научных публикаций. — Электрон. дан. — Режим доступа: http://scholar.google.ru/ — Загл. с экрана. — 20.04.2015.
2.    Научная электронная библиотека eLIBARAR.RU — [Электронный ресурс]: научная электронная библиотека. — Электрон. дан. — Москва: 2000. — Режим доступа: http://elibrary.ru. — Загл. с экрана. — 20.04.2015.
3.    Baneyx A. “Publish or Perish’ as citation metrics used to analyze scientific output in the humanities: international case studies in economics, geography, social sciences, philosophy, and history” / A. Baneyx // Archivum Immunologiae Et Therapiae Experimentalis. — 2008. — Vol. 56 № 6, P. 363—371.
4.    Couto F.M. “Handling self-citations using Google Scholar” / F.M. Couto, P. Catai, G. Tiagp, V. Paulo // Cybermetrics. — 2009. — Vol. 13 № 1, available at: www.cindoc.csic.es/cybermetrics/articles/v13i1p2.html (accessed 5 September 2009).
5.    Jacsó P. Calculating the h-index and other bibliometric and scientometric indicators from Google Scholar with the Publish or Perish software. SAVVY SEARCHING: Online information review, 2009, V. 33, № 6, P. 1189—1200.
6.    Kotsemir M.N. Publication Activity of Russian Researches in Leading International Scientific Journals / M.N. Kotsemir // Acta naturae. — 2012, — V. 4, № 2 (13), P. 15—35.
7.    Scopus — [Электронный ресурс]: библиографическая и реферативная база данных. — Электрон. дан. — Режим доступа: http://www.scopus.com/. — Загл. с экрана. — 20.04.2015.
8.    Web of Science — [Электронный ресурс]: поисковая платформа. — Электрон. дан. — Режим доступа: http:// isiknowledge.com. — Загл. с экрана. — 20.04.2015.
9.    Yang, Kiduk. Citation Analysis: A Comparison of Google Scholar, Scopus, and Web of Science / Kiduk Yang, Lokman I. Meho // Proceedings of the American Society for Information Science and Technology. — 2006, V. 43, I. 1. — P. 1—15.