СРАВНИТЕЛЬНЫЙ АНАЛИЗ РАДИОМИЧЕСКИХ ПРИЗНАКОВ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ ПОВЕДЕНИЯ ГЛИОМ С ИСПОЛЬЗОВАНИЕМ ГРАДИЕНТНОГО БУСТИНГА CATBOOST
Журнал: Научный журнал «Студенческий форум» выпуск №21(372)
Рубрика: Медицина и фармацевтика

Научный журнал «Студенческий форум» выпуск №21(372)
СРАВНИТЕЛЬНЫЙ АНАЛИЗ РАДИОМИЧЕСКИХ ПРИЗНАКОВ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ ПОВЕДЕНИЯ ГЛИОМ С ИСПОЛЬЗОВАНИЕМ ГРАДИЕНТНОГО БУСТИНГА CATBOOST
Оценка агрессивности и мониторинг ответа на терапию при глиомах головного мозга остаются одной из наиболее сложных задач современной нейроонкологии. Стандартная структурная магнитно-резонансная томография (МРТ) не позволяет достоверно дифференцировать истинную прогрессию опухоли от феномена псевдопрогрессии, вызванного лучевой или химиотерапией [1, с. 535]. В виду этого возрастает интерес к радиомике – междисциплинарному направлению, позволяющему извлекать из медицинских изображений количественные дескрипторы, которые невидимы при визуальном анализе.
Целью данной работы является оценка эффективности использования радиомических признаков, извлеченных из парных МРТ-снимков глиом в соответствии со стандартом IBSI (инициатива по стандартизации биомаркеров изображений), для задачи классификации динамики состояния пациентов с применением алгоритма градиентного бустинга CatBoost.
Модель CatBoost предназначена для решения задач классификации и регрессии на основе структурированных табличных данных. Входными данными служат радиомические признаки, извлечённые из сегментированных областей опухоли, которые были обработаны и нормализованы непосредственно из датасета глиом BRATS [3].
Выбор алгоритма CatBoost обусловлен высокой производительностью на табличных данных средней размерности, обладает встроенной обработкой пропущенных значений и устойчив к переобучению благодаря регуляризации [2, c. 6638].
Модель классификации использует функцию потерь MultiClass с оптимизацией логарифмической потери для трёхклассовой задачи. Гиперпараметры для модели установлены следующими: глубина деревьев 6, темп обучения 0,05, количество итераций 500. Модель CatBoost обучается на данных пар пациентов, не захватывая сами МРТ сканы каналов. Она принимает лишь предварительно изъятые текстурные признаки, а также радиомические признаки и флаг диагноза.
В рамках исследования были проведены эксперименты по оценке эффективности модели CatBoost для решения задачи классификации динамики состояния пациентов на три класса: «Стабильно», «Прогрессия», «Регрессия».
На первом этапе модель обучалась на парных данных, однако предсказание осуществлялось на основе признаков, извлечённых только из одного снимка. По итогу, Суммарная точность модели не превышала 53 %
Для повышения качества предсказаний была модифицирована методика обучения: модель стала требовать наличие минимум двух снимков, полученных в различные моменты времени. Результаты работы данной модифицированной модели представлены в таблице.
Таблица 1.
Результаты предсказания второй итерации модели CatBoost
|
Класс |
Precision |
Recall |
F1-Score |
Количество пациентов |
|
Стабильно |
0,316 |
0,174 |
0,224 |
69 |
|
Прогрессия |
0,595 |
0,669 |
0,630 |
145 |
|
Регрессия |
0,587 |
0,646 |
0,615 |
130 |
Анализ результатов второго эксперимента выявил значительный прирост метрик для классов «Прогрессия» и «Регрессия».
Модель смогла лучше дифференцировать рост от уменьшения опухоли. Это подтверждает гипотезу о важности учёта временной последовательности для выявления изменений состояния пациента. Визуализация результатов модели на рисунке в виде матрицы ошибок показывает, что наилучшая точность достигнута в классе «Прогрессия».

Рисунок 1. Матрицы ошибок модели CatBoost для первого и второго эксперимента
В ходе работы были выявлены несколько ограничений. Модель CatBoost обучалась исключительно на табличных признаках, извлечённых из медицинских снимков, не используя пространственные текстурные особенности изображений. Общий размер датасета так же являлся ограничением.

