Повышение времени проката установок электроцентробежных насосов методами машинного обучения
Конференция: XXV Международная научно-практическая конференция «Научный форум: технические и физико-математические науки»
Секция: Информатика, вычислительная техника и управление
XXV Международная научно-практическая конференция «Научный форум: технические и физико-математические науки»
Повышение времени проката установок электроцентробежных насосов методами машинного обучения
Improving the production of electric centrifugal pump by machine learning methods
Oleg Pilipenko
aspirant, Moscow Physic and Technique Institute, Russia, Moscow
В статье рассматриваются методы машинного обучения, как средство анализа данных, получаемых оператором с целью выявления аномалий и повышения эффективности работы насосного оборудования электроцентробежного типа. Современное нефтегазодобывающее предприятие способно вырабатывать около 1 Тб данных в день, однако использование накопленного ресурса происходит не оптимальным образом. Как правило, данные складываются в базу данных и по запросу компании-добытчика происходит выгрузка для НИИ, с целью анализа. Предлагается подход предиктивного предсказания возможности возникновения аварийной ситуации в режиме реального времени.
Статистка аварий установок электроцентробежного насоса (УЭЦН) говорит о том, что среднее время проката насоса составляет около двух лет. Причем гарантийными случаями считается, если насос не проработал года. Этот факт, а также то, что количество установок УЭЦН в России постоянно растет с темпом 10 тысяч в год данная проблема предполагает возникновение проблемной ситуации комплексного характера.
В статье не описываются конструкционные особенности УЭЦН, а рассматриваются типы аварий, наиболее важные параметры, влияющие на срок службы насоса и результаты применения методов машинного обучения к данным оператора для предсказания поломки.
Среди всех типов аварий УЭЦН можно выделить семь основных [2]:
- Отказы по причине солеотложения. Эта проблема стала более актуальной ввиду прогрессирующего роста обводнённости нефти в последние годы на месторождениях России.
- Отказы из-за высокой концентрации взвешенных частиц. Большое количество частиц приводит к уменьшению сечения насосно-компрессорных труб.
- Повреждение кабельной линии. Бывают двух типов 1 – механические, 2 – коррозионные.
- Отказ НКТ.
- Проблема отказа погружного электродвигателя (ПЭД) и гидрозащитой. Проблема заключается в том, что при срыве подачи ПЭД перегревается и иногда при этом прорывается диафрагма.
- Замерзание обратного клапана.
- Влияние газа на добычу.
Среди всех типов наиболее частыми являются 1, 4 и 5, которые, как показала практика применения методов машинного обучения, можно предиктивно предсказывать. Как правило причины возникновения аварии очень сильно коррелируют с следующими параметрами:
- Давление на приеме насоса
- Обводненность и газовый фактор
- Температура нефти
- Частота вращения ПЭД
- Вибрации ПЭД
- Ток, напряжение и температура ПЭД
Для формирования методической базы формирования предлагаемого предиктивного подхода опробованы следующие методы машинного обучения: сверточная нейронная сеть (Convolutional Neural Network), Метод опорных векторов для одного класса (One Class SVM) [3], Метод главных компонент и анализ единичного спектра (PCA, SSA), Энергетическая генеративная нейронная сеть (EB-GAN). Однако наибольшее количество верных предсказаний смог сделать метод сверточных нейронных сетей. Все методы применены для предиктивного контроля поломок УЭЦН при этом использовалась практика подобная эвристическому прикладному подходу, рассмотренному в [1]. За основу нейросети взята архитектура Res-NET50. Концепция построения архитектуры Res-NET50 основана на идее обучения предсказания отклонения текущих слоев от предыдущих. Реализуется идея за счет добавления «identity» слоя в нейросеть на разных этапах обучения. Нейросеть данного типа выиграла соревнование Imagenet Recognition Challange 2015 и стала стандартом де-факто при распознавании изображений.
В нашем случае данные для обучения получены с реальных месторождений от разных нефтедобывающих компаний. Общее количество аварий 48. Временные ряды насчитывают от 1000 до 100000 отсчетов следующих параметров: давление на приеме насоса, частота вращения, сдвиг фаз напряжений, величина тока на обмотке мотора, температура мотора насоса, вибрации. Согласно классификации, определенной в [1] данные параметры, относятся к эксплуатационным данным и являются наиболее информативными. Заявленное количество аварий является слишком маленьким для того, чтобы было возможно обучить на них нейросеть, поэтому был сформирован дополнительный прикладной метод создания датасета, который позволяет сформировать из 50 поломок бесконечно большое количество данных ввиду того, что временной ряд имеет большую длину до аварии. Метод заключается в том, чтобы разделить каждый файл с информационным массивом данных на временные отрезки: нормальная работа, предаварийная работа, авария, после аварийная работа (рисунок 1).
Рисунок 1. Информационный массив данных (временные отрезки)
Рисунок 1 отражает логику сверточной нейросети которая использует случайное число во времени отсчета для попадания в один из классов. Далее происходит создание картинки как +100 временных отсчетов до сгенерированной точки и –100 после сгенерированной точки. На следующем этапе происходит отрисовка картинки и ее сохранение с присвоением класса, которому принадлежит сгенерированная центральная точка. В итоге получаются разные случаи формирования данных в каждом из классов и прежде всего в классе аварий.
Рисунок 2. Результат предсказания алгоритма
На рисунке 2 представлен результат работы алгоритма распознавания после обучения сверточной нейросети с архитектурой Res-NET50. Работа алгоритма строится так, чтобы окном определённого размера (в случае на картинке - 100 минут) и со сдвигом в 30 секунд, передвигаться по значениям ряда и строить изображение окна для нейронной сети. Далее сеть предсказывает на 100 минут вперед развитие тренда. Данное окно и горизонт предсказания можно увеличивать.
Обучение сверточной нейросети происходило в течение 100 эпох. Оценка точности работы алгоритма производилась посредствам F-меры с параметром betta=3, так как в нашем случае наиболее важна точность, а не полнота. Итоговый результат после 100 эпох обучения равен 97% распознавания аномального поведения перед аварией. Результаты всех рассмотренных методов приведены в таблице 1.
Таблица 1.
Cравнение работы методов машинного обучения на данных диспетчерских служб
Полученные результаты показали, что некоторые из методов машинного обучения способны выявлять аномалии в данных и предсказывать их появление за несколько часов до аварии, однако для многих нефтедобывающих компаний такое высокое качество за три часа до аварии является неприемлемым, поэтому необходимо увеличить время предсказания минимум до 1 дня, чтобы решение могло бы принести для производителей нефти реальную ценность.