Статья:

Комплекс методов и способов получения актуального контента для информационно-справочных систем

Конференция: XIV Международная научно-практическая конференция «Научный форум: инновационная наука»

Секция: Технические науки

Выходные данные
Кузминский П.В. Комплекс методов и способов получения актуального контента для информационно-справочных систем // Научный форум: Инновационная наука: сб. ст. по материалам XIV междунар. науч.-практ. конф. — № 5(14). — М., Изд. «МЦНО», 2018. — С. 50-54.
Конференция завершена
Мне нравится
на печатьскачать .pdfподелиться

Комплекс методов и способов получения актуального контента для информационно-справочных систем

Кузминский Павел Валентинович
магистрант, Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева, РФ, г. Красноярск

 

A set of methods and ways for obtaining current content for information systems

 

Pavel Kuzminskii

master’s degree, Reshetnev Siberian State University of Science and Technology, Russia, Krasnoyarsk

 

Аннотация. Описаны три способа получения актуального контента на примере информационно-справочной системы по подбору хостинг-провайдеров. Методы основаны на технологиях парисинга, API и панели администратора.

Abstract. Three methods for obtaining actual content are described using the example of a searching system for selecting hosting providers. Methods are based on parsing technologies, API and admin panel.

 

Ключевые слова: информационная система; контент; парсинг.

Keywords: information system; content; parsing.

 

Распространение информации, ее дальнейший сбор и переработка внутри современного общества происходит благодаря специальным ресурсам: человеческим, финансовым, техническим и другим. В опреде­ленный момент эти данные собираются в одном месте, структурируются по заранее определенным критериям, объединяются в удобные для использования специальные базы. Информационная система является инструментом, при помощи которого осуществляется обработка посту­пивших сведений. Основная функция информационной системы состоит в обеспечении актуальной информацией пользователей. Одной из групп информационных систем являются информационно-справочные системы, которые определяются как структура, предоставляющая данные по специальному запросу. Такие системы предназначены для быстрого поиска и подачи сведений в удобном формате. Примером такой системы будет служить интернет-сайт по подбору хостинг-провайдеров.

Справочную информацию, которая хранится в таких информацион­ных системах необходимо как можно чаще обновлять. Например, хостинг-провайдеры могут менять цены на свои тарифные планы, либо добавлять или убирать тарифные линейки. А информация об этих тарифах так и осталась без изменений на сайте по подбору хостинг-провайдеров. На этот момент пользователи этой системы видят неверную информацию.

Эту проблему поможет решить обновление в реальном времени. Иными словами, если изменится информация на сайте хостера, изменится и информация на сайте по подбору хостера. Таким, образом это позволит избежать наличия неверной информации на сайте.

Подобное можно сделать используя совокупность различных методов и технологий.

Одной из технологий может являться метод парсинга. Парсинг – последовательный синтаксический анализ информации, размещённой на интернет-страницах [1]. Парсинг является эффективным решением для автоматизации сбора и изменения информации. По сравнению с человеком, компьютерная программа-парсер [2]:

·      быстро обойдёт тысячи веб-страниц;

·      аккуратно отделит техническую информацию от «человеческой»;

·      безошибочно отберёт нужное и отбросит лишнее;

·      эффективно упакует конечные данные в необходимом виде.

Технологию парсинга применяемую в интернет-сайтах возможно реализовать используя язык программирования PHP.

Схема парсинга представлена на рисунке 1.

 

Рисунок 1. Схема парсинга

 

Работа данного метода может быть реализована следующим образом. Система получает требование от информационной системы по подбору хостинг-провайдеров об обновлении информации о хостере. В качестве требования выступают команды либо от пользователя, либо от самой информационной системы в назначенное время. На следующем этапе, система обновления проверяет условие, если сайт способен отдать данные в JSON формате, то система получает их. Если такой способ недоступен, то система отправит запрос на получение данных в формате HTML-кода. После успешного получения информации, система отсор­тирует и очистит ее от лишнего «мусора» и запишет ее в базу данных. Конечным результатом будет являться вывод текстовой информации в удобочитаемом виде пользователю системы.

При реализации данного метода информация будет поступать с сайта необходимого хостера в информационную систему автоматически. Этот скрипт будет мониторить нужный сайт и брать оттуда информацию, как только она изменится.

Другим методом может являться получение информации от API‑сервиса. API – это набор классов, процедур и функций, предос­тавляемых приложением для использования во внешних программных продуктах [4].

Схема системы работающей с помощью API представлена на рисунке 2.

 

Рисунок 2. Схема API

 

Информационная система выполняет соединение с API-сервисом. Для этого отправляется соответствующий запрос, с указанием уникаль­ного API-ключа. Затем, если запрос верный, сервис отправляет ответ в виде запрашиваемой информации. Конечным результатом будет являться код, который система обработает, очистит от лишнего «мусора» и запишет в базу данных.

Эти два способа организации обновления контента позволят минимизировать вовлечение человека в работу системы.

Еще одним способом организации обновления информации в системе может являться использование панели администратора. Панель администратора позволяет получить доступ ко всем разделам сайта. С ее помощью можно добавлять, изменять или удалять страницы, а также их содержимое. Доступ в панель должен быть только у администратора системы, либо у модератора, которому можно ограничить права. Такими ограничениями могут выступать наличие прав на добавление и изменение информации, без возможности ее удаления. Доступ к панели администратора может быть организован при помощи логина и пароля. Другим способом входа в панель может быть наличие соответствующего статуса у пользователя, который может быть задан в базе данных.

Данный способ позволит в полуавтоматическом режиме следить за обновлением информации в информационной системе.

Таким образом, при помощи выше приведенных методов можно реализовать обновление контента с привлечением человеческих ресурсов, так и без них в автоматическом режиме. Рассмотренные способы помогут решить проблему хранения неактуальной информации в информационно-справочных системах.

 

Список литературы:
1. Парсинг. Что это и где используется [Электронный ресурс]. – Режим доступа: https://www.ipipe.ru/info/parsing.html (Дата обращения: 15.05.2018).
2. Учебник по парсингу сайтов [Электронный ресурс]. – Режим доступа: http://theory.phphtml.net/books/advanced/php/parsing/ (Дата обращения: 15.05.2018).
3. Фленов М. PHP глазами хакера: 2-е изд., доп. и перераб. СПб.: БХВ-Петербург, 2010. 336 с.
4. Что такое API [Электронный ресурс]. – Режим доступа: http://php-include.ru/stati/chto-takoe-api (Дата обращения: 15.05.2018).