Назначение и применение аналитической платформы Дедуктор
Секция: Экономика
XII Студенческая международная научно-практическая конференция «Общественные и экономические науки. Студенческий научный форум»
Назначение и применение аналитической платформы Дедуктор
Дедуктор – это система для создания эффективной теории по принятию бизнес – решений за короткий промежуток времени.
С помощью него, возможно формирование общей аналитической функции над абсолютно всеми существующими в компании системами сбора и хранения данных, таких как трейдерские концепции, счетоводные концепции, единичные основы и других.
Главная фишка в том, что, если нужно, Дедуктор автоматически объединит данные из разных источников [2].
Так как Дедуктор включает в себя полный набор компонентов, требуемых с целью решения установленной проблемы, то он оптимизирован для постановления вопросов.
В этот набор входит: получение информации из множества источников данных, полный спектр элементов очищения и редактирования сведений, мощные самообучающиеся методы возведения вариантов и выявления взаимосвязей, большое количество элементов изображения и выноса итогов в разные форматы. Все это помогает обеспечивать формирование результативных подлинных заключений в минимальные сроки. Что входит в состав Дедуктора, рассмотрим в таблице 1.
Таблица 1.
Состав Дедуктора 5
На рисунке 1 отображается процесс извлечения знаний из данных.
Рисунок 1. Процесс извлечения знаний из данных
Сначала вводятся данные из того или иного источника, так как хранилище данных Дедуктор Warehouse – это одно из источников/приемников данных. Как правило, в систему загружаются не все данные, а какая-то выборка, требуемая для последующего рассмотрения. Далее можно получить детальную статистику по ней, ознакомиться, как выглядят данные на диаграммах и гистограммах. Последующим шагом является принятие решения о необходимости предобработки данных.
К примеру, в случае если же в выборке имеются пустые значения (пропуски данных), то для их ликвидации используют фильтрацию [3].
Данные, которые считаются до предобработки, подвергаются изменению. Например, когда нечисловые сведения преобразуются в числовые. Они же считаются необходимым обстоятельством для некоторых алгоритмов. Непрерывные данные могут быть разбиты на промежутки, то есть выполняется их квантование [3].
Способы углубленного рассмотрения применяются к трансформированным данным. То есть происходит выявление скрытых зависимостей и закономерностей в данных, на основании которых строятся различные модели. Образец, который включает в себя формализованные знания, считается моделью [2].
Следующая стадия, которая называется интерпретация, предназначена для получения знания на языке предметной области из формализованных знаний.
В конечном итоге происходит копирование познаний – это когда осуществляется предоставление людям, которые принимают решения, способности фактического использования созданных вариантов.
Прежде, чем сделать это, необходимо решить некоторые задачи, которые рассмотрены ниже в таблице 2.
Таблица 2.
Задачи для реализации концепции тиражирования знаний
|
Задачи |
1 |
Обеспечив стандартный способ получения любой информации, необходимой для анализа, аккумулировать данные, необходимые для анализа, |
2 |
Формализовать знания специалистов, а также трансформировать их знания в модели, которые пригодны для автоматизированной обработки. |
3 |
Подобрать способы визуализации и отобразить результаты обработки наиболее удобным способом. |
4 |
Предоставить возможность работать сотрудникам с формализованными знаниями экспертов как с «черным ящиком», т.е. без необходимости вникать в то, каким образом реализована обработка внутри. |
Рассмотрим далее, как это происходит подробнее.
Создается хранилище данных – Дедуктор Warehouse, который консолидирует всю необходимую для анализа информацию. Механизмы автоматического обновления сведений настраиваются в хранилище. Это необходимо для оперативного получения актуальной непротиворечивой и целостной информации для последующего анализа [2]. Эксперт настраивает сценарии обработки, это значит, определяет путь, который необходимо пройти для получения нужного результата. Не всегда это возможно с одного шага, скорее будет цепочка, состоящая из разного рода обработок.
Например, порядок действий может быть таким: приобрести сгруппированные необходимым способом сведения => выполнить очистку их от выбросов => сгладить => построить модель => «прогнать» новые данные. Подготовка последовательности наиболее сложная часть работы. Для этого требуются познания в предметной области и представление способов рассмотрения. В принципе это способен выполнить единственный человек в организации [3].
Далее на Рисунке 1 рассмотрим, как это происходит при работе в интерактивном режиме.
Рисунок 2. Работа в интерактивном режиме
На Рисунке 2 показан процесс при автоматическом режиме.
Рисунок 3. Работа в автоматическом режиме
В конечном итоге пользователю получит результаты обработки в наиболее удобном для анализа и принятия решения виде.