Статья:

СТАТИСТИЧЕСКИЙ АНАЛИЗ РАСПРОСТРАНЕНИЯ COVID-19 В ПСКОВСКОЙ ОБЛАСТИ

Конференция: LI Студенческая международная научно-практическая конференция «Естественные и медицинские науки. Студенческий научный форум»

Секция: Медицина и фармацевтика

Выходные данные
Гусарова С.В., Архипова И.В. СТАТИСТИЧЕСКИЙ АНАЛИЗ РАСПРОСТРАНЕНИЯ COVID-19 В ПСКОВСКОЙ ОБЛАСТИ // Естественные и медицинские науки. Студенческий научный форум: электр. сб. ст. по мат. LI междунар. студ. науч.-практ. конф. № 5(51). URL: https://nauchforum.ru/archive/SNF_nature/5(51).pdf (дата обращения: 23.04.2024)
Лауреаты определены. Конференция завершена
Эта статья набрала 13 голосов
Мне нравится
Дипломы
лауреатов
Сертификаты
участников
Дипломы
лауреатов
Сертификаты
участников
на печатьскачать .pdfподелиться

СТАТИСТИЧЕСКИЙ АНАЛИЗ РАСПРОСТРАНЕНИЯ COVID-19 В ПСКОВСКОЙ ОБЛАСТИ

Гусарова Светлана Валерьевна
студент, Псковский государственный университет, РФ, г. Псков
Архипова Ирина Васильевна
студент, Псковский государственный университет, РФ, г. Псков
Иванова Наталья Владимировна
научный руководитель, д-р мед. наук, проф., Псковский государственный университет, РФ, г. Псков
Самаркин Александр Иванович
научный руководитель, канд. техн. наук, доцент, Псковский государственный университет, РФ, г. Псков

 

С момента эпидемической вспышки в первые месяцы 2020 года распространение COVID-19 быстро росло в большинстве стран и регионов мира. В связи с этим 30 января 2020 года Всемирная организация здравоохранения (ВОЗ) объявила SARS-CoV-2 чрезвычайной ситуацией в области общественного здравоохранения, имеющей международное значение. Вот почему многие ученые работают над новыми методами анализа течения пандемии. Однако для принятия корректных управленческих решений, направленных на снижение уровня заболеваемости COVID-19, необходимы модели прогнозирования в реальном времени, которые могут надежно поддерживать такие решения как на национальном, так и на международном уровне [1][2].

Для анализа данных используется их представление в виде временных рядов — значения, записанные в некоторые, обычно равноудаленные, моменты времени. Расчет может выполняться с различными интервалами: через минуту, час, день, неделю, месяц или год, в зависимости от того, насколько подробно должен быть проанализирован процесс. В задачах анализа временных рядов мы имеем дело с дискретным временем, когда каждое наблюдение параметра характеризуется временными рамками, что полностью применимо и для Covid-19.

В качестве аппарата статистического анализа применяются: варианты метода экспоненциального сглаживания, авторегрессионные модели, спектральный анализ, а также искусственные нейронные сети.

В данной работе приводится механизм прогнозирования заболеваний Covid-19 с использованием нейронных сетей. Такой подход полезен, когда необходимо преодолеть трудности, связанные с нестационарностью, неполнотой, неизвестным распределением данных, или когда статистические методы не вполне удовлетворительны [3].

Задача прогнозирования решается с помощью аналитической платформы МАТЛАБ (MATLAB). При решении данной задачи использовались реализованные в пакете методы очистки данных от шумов и аномалий, что обеспечивало качество построения прогностической модели и получения прогнозных значений на две-три недели вперед. Использовался типичный алгоритм анализа временных рядов: импорт, обнаружение сезонности, выявление тренда, сглаживание, построение прогностической модели, прогнозирование и сравнение прогноза с реальными сведениями о заболевании Covid-19 с использованием нейронных технологий [4].

Проблемой при разработке такой системы является отсутствие общих знаний о том, как распространяется вирус и каково будет количество случаев заболевания каждый день ввиду принципиальной стохастичности указанного процесса. Поэтому модель прогнозирования должна быть способна сделать вывод о ситуации на основе прошлых данных таким образом, чтобы результаты показывали будущую тенденцию и, демонстрировали корреляцию с реальными данными. Искусственный интеллект дает такую возможность [5].

Ситуация с эпидемией COVID-19 в мире очень динамична, и без моделей прогнозирования мы не можем оценить, как будет развиваться ситуация. Проблемой при построении таких прогностических систем является отсутствие знаний и данных для их легкого составления, поскольку у нас нет никакой информации о распространении вируса до его начала. Мы можем оценить его только по данным за чрезвычайно короткий промежуток времени, в течение которого ситуация быстро меняется, а сам временной ряд не является стационарным. Существует несколько методов, которые помогают прогнозировать в таких ситуациях, однако в основном сообщается о нейронных сетях из-за хорошего обобщения и точного прогнозирования в случае неопределенных сред [6].

Наиболее часто используемыми традиционными пандемическими схемами являются модели восприимчивый—инфицированный—выздоровевший (SIR) и восприимчивый—подверженный—инфицированный—выздоровевший (SEIR), где “S”, “E”, " I” и “R” означают каждое количество восприимчивых людей, количество людей во время фазы инкубации, количество заразных людей и количество улучшенных людей соответственно. Эти модели предназначены для прогнозирования множественных заболеваний, таких как Эбола и атипичная пневмония, благодаря их надежным прогностическим способностям связанных показаний. С появлением и распространением COVID-19 важной исследовательской задачей является прекращение роста распространения этого заболевания, которое наблюдается в нескольких областях науки по всему миру. Таким образом, различные подходы к моделированию, оценке и прогнозированию реализуются для понимания и контроля этой пандемии. Традиционные модели заболеваний измеряют скорость заражения на основе комплексного изменения количества загрязнений, а затем определяют характер распространения и эволюции заболевания. Тем не менее, эти подходы предполагают, что все люди с коронавирусом имеют равные шансы на заражение, и, следовательно, их прогностические результаты могут указывать только на общие закономерности и ограничены [7].

Искусственный интеллект (ИИ) в последнее время применяется для стимулирования биомедицинских исследований и в многочисленных областях, таких как идентификация изображений, категоризация объектов, сегментация изображений и подходы глубокого обучения. Например, у людей, затронутых COVID-19, возможно, будет пневмония, поскольку инфекция достигает легких. Многие исследования глубокого обучения идентифицируют состояние пациентов с помощью рентгеновских изображений грудной клетки. Три различные модели глубокого обучения использовались в прошлом для распространения рентгеновских изображений пневмонии. С другой стороны, большинство моделей прогнозирования используют рентгеновские и КТ-изображения, основанные на методе глубокого обучения, который требует больше времени для извлечения функций и обучения модели.

Известные классические математические дифференциальные уравнения и модели прогнозирования населения имеют ограничения на прогнозирование населения во временных рядах и значительные ошибки оценки. Аналитические методы, например, авторегрессионная скользящая средняя (ARIMA), скользящая средняя (MA) и авторегрессионные методы (AR), в основном сформулированы на предпосылках. Тем не менее, они испытывают трудности в прогнозировании скорости циркуляции крови. Огромное разнообразие демографических и вычислительных моделей были разработаны для моделирования безудержной динамики передачи COVID-19. Однако во многих ситуациях эти подходы не соответствуют предоставленной информации, и точность прогноза обычно низкая. Поэтому в данной работе исследуется модифицированный подход LSTM к прогнозированию вероятных случаев и смертей от COVID-19. Он также описывает глубокое обучение с подкреплением для оптимизации результатов прогнозирования на основе симптомов. Эксперименты с использованием реальных данных и различных метрик показывают улучшенную производительность работы [8].

В последнее время многие работы ориентированы на вычисление распространения вируса covid-19 как в региональном, так и в мировом масштабе. Предлагаемый нами подход ориентирован на машинное обучение (особенно на специализированную архитектуру нейронной сети), и благодаря этому предлагаемая система способна предсказать тенденцию распространения covid-19 для различных стран и регионов в любой точке земного шара, что делает наше предложение большим преимуществом [6].

Рассматриваются вопросы применения нейронных сетей к распространению вирусных инфекций на примере Псковской области.

Так на ход пандемии оказывает влияние большое количество факторов, нейронные сети обладают способностью учесть неизвестные заранее особенности сложно организованных процессов.

Отмечается, что региональные особенности сказываются не только на ходе пандемии, но и на особенности организации статистического учета.

Описание и прогноз хода пандемии является сложной математической проблемой, для решения которой необходим учет большого количества влияющих факторов. Наряду с детерминированными моделями SEIR хорошо себя зарекомендовали модели на основе искусственных нейронных сетей.

Анализ нестационарных и нерегулярно-сезонных рядов можно проводить, используя как LTSTM, так и рекуррентные нейронных сетей (NAR).

Это особенно важно на региональном уровне, где приходится учитывать особенности конкретного региона, статистические данные с региональной спецификой и малые объемы популяции.

Рассмотрим пример подготовки данных и обучение нейронных сетей для прогнозирования хода пандемии.

Для обучения нейронных сетей использовались официальные сведения о количестве заболевших COVID-19 (нарастающим итогом и посуточно) и количество умерших за весь срок пандемии до 14 февраля 2022 г. Данные сглаживались для снижения влияния частоты подачи отчетов первичного звена, устранялись ошибки.

По каждой выборке обучалась отдельная сеть, которая в дальнейшем преобразовывалась в форму, удобную для расчета прогноза.

По результатам выполнен прогноз хода пандемии на 14 дней. Заметим, что прогноз составлялся на время активного распространения штамма омикрон.

Модели демонстрируют хорошее соответствие расчетных и наблюдаемых показателей за период наблюдения.

Нейронные сети дают сравнительно хорошее качество прогноза на период 1 неделю.

Разница с наблюдаемыми результатами не превышает 2-3%.

Через 7 дней прогноз значительно расходится с наблюдениями, что объясняется двумя факторами: в рассматриваемый период штамм омикрон распространялся экспоненциально, рекуррентная модель использует для прогноза только данные временного ряда, в том числе – свой же собственный прогноз.

Нейронные сети демонстрируют высокие прогностические качества, которые могут быть улучшены за счет: подбора оптимального количества нейронов скрытого слоя и количества входов, а также подключения временных рядов с дополнительной информацией (например, количеством вакцинированных пациентов). Таким образом, статистический анализ течения пандемии также необходимо выполнять комплексным образом, анализируя не только очевидные показатели по заболеваемости, но и значительный объем дополнительных параметров, которые могут носить не только чисто медицинский характер.

Так, например, существенное влияние на ход пандемии оказывает деятельность государственных органов (организация вакцинации, введение ограничений по передвижению и норм социального взаимодействия, введение школьных каникул и т.п.). Вероятно, влияние климатических факторов, и таких форс-мажорных обстоятельств как появление новых штаммов вируса с существенно отличающимися показателями вирулентности и контагиозности.

 

Список литературы:
1. Новая  коронавирусная болезнь  (Covid-19)  и  сердечно-сосудистые  заболе-вания / О.Л. Барбараш, В.Н. Каретникова, В.В. Кашталап и  др.  //  Комплексные проблемы сердечно-сосудистых заболеваний. – 2020. – Т. 17, № 28. – С. 17–28.
2. Coronavirus infections [Электронный ресурс]. URL: https://www.paho.org/en/topics/coronavirus-infections.
3. Буланов Андрей Юльевич, Симарова И.Б., Буланова Е.Л., Синявкин Д.О., Феклистов А.Ю., Работинский С.Е., Катрыш С.А. Новая Коронавирусная Инфекция Covid-19: Клиническая И Прогностическая Значимость Оценки Фибриногена плазмы // Вестник интенсивной терапии имени А. И. Салтанова. 2020. №4. URL: https://cyberleninka.ru/article/n/novaya-koronavirusnaya-infektsiya-covid-19-klinicheskaya-i-prognosticheskaya-znachimost-otsenki-fibrinogena-plazmy (дата обращения: 15.05.2022).
4. Нейронные сети. Реализация в Matlab: учебное пособие / С.Г. Николаева. – Казань: Казан. гос. энерг. ун-т, 2015. – 92 с.
5. Гечили, Э. Прогнозирование подтвержденных случаев заболевания Covid-19, смертей и выздоровлений: Revisit-ing установила моделирование временных рядов с помощью новых приложенийдля США и Италии / E. Gecili, Z. Ассем и Д. С. Ронда // PloS one. – 2021. -Том 16, № 1. – С. 1-11,
6. Real-time neural network based predictor for cov19 virus spread Michał Wieczorek, Jakub Siłka, Dawid Połap, Marcin Woźniak, Robertas Damaševičius Published: December 17, 2020 https://doi.org/10.1371/journal.pone.0243189
7. Dadyan, E. Application of neural network technologies in prediction of covid-19 infection in the world Preprints 2021 , 2021030746
8. Использование Matlab (11) нейронные сети [Электронный ресурс]. URL: https://russianblogs.com/article/9358188315/
9. Ефименко Г.А., Синица А.М.: Нейронные сети в MatLab [Электронный ресурс] // Digiratory. 2017 г. URL: https://digiratory.ru/508.
10. Recurrent Neural Network and Reinforcement Learning Model for COVID-19 PredictionCrossref Published Online: April 10, 2021 https://doi.org/10.3389/FPUBH.2021.744100