Статья:

Обзор некоторых методов сжатия изображений

Конференция: LIII Студенческая международная научно-практическая конференция «Молодежный научный форум»

Секция: Технические науки

Выходные данные
Тюльков В.С. Обзор некоторых методов сжатия изображений // Молодежный научный форум: электр. сб. ст. по мат. LIII междунар. студ. науч.-практ. конф. № 23(53). URL: https://nauchforum.ru/archive/MNF_interdisciplinarity/23(53).pdf (дата обращения: 26.04.2024)
Лауреаты определены. Конференция завершена
Эта статья набрала 0 голосов
Мне нравится
Дипломы
лауреатов
Сертификаты
участников
Дипломы
лауреатов
Сертификаты
участников
на печатьскачать .pdfподелиться

Обзор некоторых методов сжатия изображений

Тюльков Вячеслав Сергеевич
магистрант, Балтийский государственный технический университет «ВОЕНМЕХ» им. Д.Ф. Устинова, РФ, г. Санкт-Петербург

 

Введение

Сжатие изображений очень важно для эффективной передачи и хранения изображений. Потребность в передаче мультимедийных данных через телекоммуникационную сеть и доступ к мультимедийным данным через Интернет возрастает с большой скоростью. В связи с применением цифровых камер требования к хранению, обработке и передаче цифровых изображений резко возросли.

За последние несколько десятилетий, возросла потребность в хранении и передаче цифровых изображений, сжатие стало необходимым приложением при хранении и передаче данных. С использованием цифровых камер требования к хранению, обработке и передаче цифровых изображений резко возросли. Существует множество методов сжатия изображений, но потребность в более быстрых надежных и эффективных алгоритмах все еще актуальна. [1].

Используя методы сжатия данных, можно удалить некоторое количество избыточной информации. Это уменьшит размер файла и позволит хранить больше изображений на диске или в памяти.

Принцип сжатия

Общей характеристикой большинства изображений является то, что соседние пиксели коррелированы и, следовательно, содержат избыточную информацию. Первоочередная задача - найти менее коррелированное представление изображения. Два элементарных компонента сжатия — это уменьшение избыточность и неактуальности. Уменьшение избыточности направлено на устранение дублирования от источника сигнала (изображения). Снижение неактуальности пропускает части сигнала, которые не будут замечены приемником сигнала, а именно Человеческой зрительной системой [2]. В целом, можно выделить три типа избыточности:

  • Пространственная избыточность или корреляция между значениями соседних пикселей.
  • Избыточность спектра или корреляция между различными цветовыми плоскостями или спектральными полосами.
  • Временная избыточность или корреляция между соседними кадрами в последовательностях изображений (в видеоприложениях).

Так как мы ориентируемся только на неподвижные изображения. Методы сжатия изображения рассматриваются в этой статье. Для сжатия изображений существует три типа избыточности:

  • Кодовая избыточности
  • Межпиксельная избыточность
  • Психовизуальная избыточность

Кодовая избыточность присутствует, когда используются не наилучшие возможные кодовые слова. Межпиксельная избыточность является результатом корреляции между пикселями изображения.

Разные классы технологий сжатия

Здесь упоминаются два способа классификации методов сжатия.

1. Сжатие без потерь против сжатия с потерями

В схемах сжатия без потерь восстановленное изображение после сжатия численно равно исходному изображению. Однако сжатие без потерь может выполнить только умеренное уменьшение объема. Изображение, восстановленное после сжатия с потерями, содержит ухудшение качества по сравнению с оригиналом. Часто это происходит потому, что схема сжатия полностью отбрасывает избыточную информацию. Тем не менее, схемы с потерями способны достичь гораздо более высокого сжатия. При нормальных условиях просмотра видимых потерь не наблюдается (визуально без потерь) [2].

2. Прогнозирующее и трансформирующее кодирование

В прогнозирующем кодировании информация, уже отправленная или существующая, используется для прогнозирования будущих значений, а разность кодируется. Поскольку это делается в области изображения или в пространственной области, его относительно просто применять, и его легко изменить в соответствии с локальными характеристиками изображения. Дифференциальная импульсная кодовая модуляция является одним из конкретных примеров кодирования с предсказанием. Кодирование с преобразованием, с другой стороны, сначала преобразовывает изображение из демонстрации его пространственной области в представление другого типа, используя некоторое известное преобразование, а затем кодирует преобразованные значения (коэффициенты). Этот метод обеспечивает лучшее сжатие данных по сравнению с прогнозирующими методами, но требует большее количество вычислительных ресурсов [3].

Различные Алгоритмы Сжатия

1. JPEG: стандарт кодирования изображений на основе дискретного косинусного преобразования (ДКП)

Сжатие неподвижных изображений JPEG / ДКП недавно стало стандартом. JPEG предназначен для сжатия полноцветных или полутоновых изображений обычных, реальных сцен [2]. Чтобы использовать эту технику, изображение сначала делится на не перекрывающиеся блоки 8 × 8. Дискретное косинусное преобразование применяется к каждому блоку для интерпретации уровней серого пикселей в пространственной области в коэффициенты в частотной области. Коэффициенты нормированы по различным шкалам в соответствии с таблицей квантования, предоставленной стандартом JPEG. Квантованные коэффициенты переупорядочиваются в порядке зигзагообразного сканирования, чтобы быть более сжатыми с помощью хорошо организованного подхода кодирования без потерь, такого как кодирование по длинам серий, арифметическое кодирование или кодирование Хаффмана. Декодирование — это просто обратная процедура кодирования [3,4]. Таким образом, сжатие JPEG занимает примерно одно и тоже время на кодировании и декодировании. Алгоритмы кодирования / декодирования, предоставляемые автономной группой JPEG, существуют для тестирования изображений реального мира. Потеря информации происходит только в методе квантования коэффициента. Стандарт JPEG определяет стандартную таблицу квантования 8 × 8 для всех изображений, которая может и не подходить. Чтобы достичь лучшего качества декодирования различных изображений с одинаковым сжатием с использованием подхода ДКП, вместо стандартной таблицы квантования может использоваться таблица адаптивного квантования.

Сжатие изображения с помощью вейвлет-преобразования

Вейвлеты — это функции, определенные в ограниченном интервале и имеющие стандартное значение ноль. Основная идея вейвлет-преобразования состоит в том, чтобы различать любую произвольную функцию (t) как суперпозицию набора таких вейвлетов или базисных функций. Эти базисные функции или детские вейвлеты обеспечиваются одним прототипом вейвлета, называемым материнским вейвлетом, путем расширений или сокращений (масштабирование) и переводов (сдвигов). Дискретное вейвлет-преобразование сигнала конечной длины x(n), имеющего, например, N компонентов, выражается матрицей N x N [2].

Несмотря на все преимущества методов сжатия JPEG, основанных на ДКП, а именно: простота, удовлетворительная производительность и наличие специального аппаратного обеспечения для реализации; он не без их недостатков. Поскольку входное изображение должно быть «блокировано», корреляция через границы блоков не устраняется. Это приводит к заметным и раздражающимся «блочным артефактам», в основном на низких скоростях.

За последние несколько лет вейвлет-преобразование получило широкое распространение в общей обработке сигналов и, в частности, в исследованиях сжатия изображений. Во многих приложениях методы на основе вейвлетов (также называемые кодированием поддиапазонов) превосходят другие методы кодирования, такие как метод на основе ДКП. Поскольку нет необходимости блокировать входное изображение и его базовые функции имеют переменную длину, схемы вейвлет-кодирования при более высоком сжатии избегают блочных артефактов. Вейвлет-кодирование является еще более устойчивым к ошибкам передачи и декодирования, а также способствует прогрессивной передаче изображений. Кроме того, они лучше соответствуют характеристикам зрительной системы человека. Из-за присущей им природы мультиразрешения схемы вейвлет-кодирования особенно подходят для приложений, где необходимы масштабируемость и среднее ухудшение [4].

Заключение

Перечислены не все существующие методики сжатия изображений, поскольку как уже говорилось, потребность в этом очень велика, а существующие методы не удовлетворяют запросам потребителей в полной мере.

 

Список литературы:
1. Rafael C. Gonzalez, Richard E. woods, “Digital Image Processing”, Third Edition, PrenticeHall. 
2. Buccigrossi, R., Simoncelli, E. P., “EPWIC: Embedded Predictive Wavelet Image Coder”. 
3. Gersho, A., Gray, R.M., “Vector Quantization and Signal Compression”, Kluwer Academic Publishers, 1991. 
4. Malavar, H. S., “Signal Processing with Lapped Transforms”, Norwood, MA, Artech House, 1992.