МЕТОДЫ ГЕНЕРАЦИИ СИНТЕТИЧЕСКИХ КТ-ИЗОБРАЖЕНИЙ: СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ
Журнал: Научный журнал «Студенческий форум» выпуск №21(372)
Рубрика: Медицина и фармацевтика

Научный журнал «Студенческий форум» выпуск №21(372)
МЕТОДЫ ГЕНЕРАЦИИ СИНТЕТИЧЕСКИХ КТ-ИЗОБРАЖЕНИЙ: СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ
На данный момент, в сфере медицинского здравоохранения активно внедряется концепция планирования лучевого лечения исключительно по данным МРТ «MR-only». Переход к использованию единой модальности позволяет полностью устранить ошибки геометрической регистрации между КТ и МРТ данными, неизбежно возникающие из-за различий в укладке пациента на разных томографах и междробных изменений анатомии.
Практическая польза данного подхода заключается в оптимизации клинических процессов. Сокращается общее время подготовки к лечению, а также снижаются затраты клиники. Реализация концепции «MR-only» становится возможной благодаря генерации синтетических КТ-изображений (sCT) на основе МР-сканов с помощью алгоритмов машинного обучения.
Целью данной работы является сравнительный анализ и оценка эффективности базовых методов генерации синтетических КТ-изображений (sCT) для задач лучевой терапии.
В рамках концепции MR-only радиационной терапии генерация синтетических КТ-изображений (sCT) выполняется с использованием различных архитектур глубокого обучения и классических подходов.
Архитектура ResNet базируется на глубоких остаточных сетях, формируемых наложением остаточных блоков. Введение обходных связей с отображением тождественности решает проблему исчезающего градиента при обучении сетей с сотнями слоев и снижает вычислительную стоимость [1, c. 348]. В задачах синтеза sCT это уменьшает краевые эффекты сверточного процесса, обеспечивая точное воссоздание границ органов и костей. Основным преимуществом ResNet в синтезе sCT является точное восстановление единиц Хаунсфилда (HU) путем корректировки МРТ-вокселей, а также высокая стабильность глубоких моделей. Недостатками являются ориентация на локальные признаки в ущерб глобальному анатомическому контексту, высокие требования к вычислительным ресурсам GPU.
Архитектура Efficient CNN (eCNN) является модификацией сети U-Net топологии «кодировщик-декодировщик». В eCNN простые сверточные слои заменены на остаточные блоки ResNet. Для минимизации потерь пространственных данных интегрирован механизм передачи индексов максимального пулинга и модулей высокого разрешения из кодировщика в декодер [2, c. 515]. Преимущества eCNN заключаются в самонормирующихся свойствах сети, высокой точности границ костных структур и снижении размытости текстур. Недостатки включают повышенную вычислительную сложность из-за обилия параметров, строгую потребность в идеально выровненных парных данных МРТ-КТ.
Архитектура GAN основана на состязании генератора (G), создающего синтетические данные из гауссова шума, и дискриминатора (D), выступающего бинарным классификатором истинности изображений. В адаптированной для медицины архитектуре [3, c. 105], генератор использует транспонированные свертки с шагом 2, а на финальном слое – функцию активации для нормализации пикселей в диапазоне [-1, 1]. Преимущества GAN заключаются в генерации высокочастотных деталей с реалистичной текстурой тканей. Ключевые недостатки – крайняя нестабильность обучения и риск «галлюцинаций» (генерации анатомически недостоверных деталей).
Архитектура V-Net представляет собой 3D-модификацию структуры U-Net, использующую трехмерные сверточные ядра для обработки всего объема данных целиком, а не по отдельным срезам. Главным преимуществом V-Net является высокая межсрезовая консистентность, исключающая ступенчатые артефакты на границах тканей. Недостатками выступают чрезвычайно высокая вычислительная стоимость и потребность в большом количестве оперативной памяти.
Архитектура U-Net является полносверточной симметричной структурой из энкодера и декодера. К преимуществам относятся высокая точность локализации границ. Однако она так же требует большого количества оперативно памяти.
Методы на основе атласов основаны на попарной нелинейной регистрации группы МР-изображений относительно целевого МРТ. Подход надежен, но ограничен невозможностью точного моделирования индивидуальных анатомических аномалий.
Сравнительный анализ показывает, что оптимальным решением является архитектура eCNN. Интеграция остаточных блоков ResNet в топологию U-Net обеспечивает высокую точность восстановления границ костных структур без высоких затрат видеопамяти, свойственных 3D V-Net. При этом, будучи детерминированной моделью, eCNN полностью исключает риск анатомических «галлюцинаций», присущий GAN моделям.

