Статья:

Алгоритмы распознавания объектов в видеопотоке

Конференция: XLIV Студенческая международная научно-практическая конференция «Молодежный научный форум»

Секция: Технические науки

Выходные данные

Конюшков Н.К., Чес С.А. Алгоритмы распознавания объектов в видеопотоке // Молодежный научный форум: электр. сб. ст. по мат. XLIV междунар. студ. науч.-практ. конф. № 14(44). URL: https://nauchforum.ru/archive/MNF_interdisciplinarity/14(44).pdf (дата обращения: 16.08.2025)

К условиям публикации Скачать сборник

Лауреаты определены. Конференция завершена

Эта статья набрала 0 голосов

Мне нравится

Дипломы
лауреатов

Сертификаты
участников

Дипломы
лауреатов

Сертификаты
участников

XLIV Студенческая международная научно-практическая конференция «Молодежный научный форум»

на печатьскачать .pdf поделиться

Алгоритмы распознавания объектов в видеопотоке

Конюшков Николай Константинович

студент, Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича, РФ, г. Санкт-Петербург

Чес Софья Андреевна

Герлинг Екатерина Юрьевна

научный руководитель, канд. техн. наук, доцент, Санкт-Петербургский государственный университет телекоммуникаций им. проф. М. А. Бонч-Бруевича, РФ, г. Санкт-Петербург

Аннотация. Программные средства интеллектуального анализа данных используются при обработке видеоизображений, полученных с установленных на объектах камер. Разработанный алгоритм позволяет обучить нейронную сеть, которая может быть интегрирована в различных системах видеонаблюдения, для распознавания объектов видеопотока со скоростью 8-10 кадров в секунду.

Ключевые слова: объект, изображение, нейронная сеть, слой, распознавание, идентификация, алгоритм, видеопоток.

Отслеживание нескольких объектов в видеоряде является важной задачей компьютерного зрения. Многоцелевое отслеживание в онлайн-режиме имеет широкое применение в различных областях видеоанализа, таких как визуальное наблюдение, роботизированная навигация, автономное вождение и анализ спортивных событий. Применение этого метода анализа видеоряда позволяет освободить человека от решения таких задач, ранее требовавших его участия. Существующие интеллектуальные системы демонстрируют низкую производительность при столкновении с такими проблемами как частичное или полное перекрытие отлеживаемых объектов другими объектами, изменения освещенности в кадре, низкое качество изображения, непредусмотренные движения камеры и другие изменения окружающей среды. Подобные помехи приводят к потере целевого объекта и нарушению целостности трека слежения.

В связи с постоянным увеличением количества наземного транспорта особую актуальность приобретает задача контроля движения в городских условиях и на автомагистралях [1, 2, 3, 4].

Для решения данной задачи предлагается использование оптико-электронного устройства с алгоритмом выделения и классификации движущегося объекта. Оптико-электронное устройство позволяет локализовать объекты, находящиеся в зоне видимости, после чего изображение фильтруется и производится предварительное распознавание, позволяющее отделить объекты друг от друга и отбросить ненужные (человек с детской коляской, пешеходы и т. п.), выделив необходимые нам объекты, которые впоследствии передаются для последующего сравнения.

Сравнение полученной площади контура с необходимой содержит два этапа:

1. Сравнение признаков по типу

2. Проверка условий

где е - малая положительная величина.

Выполнение данных условий говорит о том, что признаки эталона и объекта однотипные и слабо отличаются друг от друга, после чего используется алгоритм, основанный на априорном формировании трехмерных эталонов распознаваемых транспортных средств и последующем сравнении текущей распознаваемой проекции транспортного средства (либо ее части) с наиболее подходящим для него, содержащимся в базе данных. Распознавание выполняется поэтапно. На первом этапе выполняется ввод изображения, затем определяются первичные признаки изображения объекта. Далее производится определение наличия проекций эталонов, имеющих схожие первичные признаки. При наличии соответствующего эталона выполняется построение соответствующей проекции и вычисление матрицы весовых коэффициентов и матрицы входных данных. На базе полученных данных выполняется принятие решения о принадлежности распознаваемого объекта к определенному классу эталона.

Распознавание существенно упрощается при получении полного изображения объекта. Тогда легко классифицировать, например, автомобиль по 3 признакам (легковой, грузовой, микроавтобус). Затем ищем информативные признаки, такие как размер капота, крыльев, форма фар, решетки радиатора и сравниваем с содержащимися эталонными значениями, таким образом, мы устанавливаем модель автомобиля. Использование данного метода позволяет сократить время распознавания в 3 раза по сравнению с аналогичными системами, трудозатраты сокращаются в 5 раз, точность распознавания находится в пределах 95-100%.

В настоящее время разработано достаточное количество алгоритмов декомпозиции и классификации, применяемых в разнообразных прикладных областях [1]:

1) байесовский классификатор;

2) искусственные нейронные сети;

3) алгоритмы ближайшего соседа;

4) лингвистические (структурные) методы;

5) деревья решений;

6) алгоритмы вычисления оценок;

7) алгоритм опорных векторов и др.

Анализ алгоритмов декомпозиции и классификации показывает, что они не всегда обеспечивают получение приемлемых решений из-за временных затрат и недостаточно обоснованного выбора значений параметров алгоритмов.

В настоящее время выделяют несколько основных типов архитектур нейронных сетей.

1. Сеть прямого распространения предполагает, что нейроны и связи между ними образуют ациклический граф, в котором сигналы распространяются только в одном направлении.

2. В рекуррентных нейронных сетях сигналы могут передаваться в обоих направлениях и в процессе обработки поступают на один и тот же нейрон несколько раз. Основной трудностью в работе с такими сетями является их обучение.

3. Самоорганизующиеся карты Кохонена, предназначенные для кластеризации и визуализации данных.

Сверточная нейронная сеть (СНС) состоит из двух основных частей

1) отвечающей за выделение признаков;

2) отвечающей за классификацию.

Преимущества декомпозиции блочной нейронной сети состоит в следующем: при неудовлетворительном качестве работы одного блока, изменения и новое обучение проводится только для выбранного блока; ускорение процесса обучения модели, за счет параллельного обучения нескольких блоков; возможность гибкого изменения всей модели; анализ и использование новых принципов к обучению блочной нейронной сети [2,3].

Наилучшее качество идентификации объектов показывают СНС, в которых часть, отвечающая за классификацию на выходные классы по выделенным признакам, реализована как полносвязная многослойная нейронная сеть, состоящая как минимум из одного скрытого слоя нейронов. В зависимости от количества выделенных признаков и количества классов объектов, которые СНС должна уметь идентифицировать, количество нейронов в скрытых слоях растут экспоненциально [3].

Пусть на вход алгоритма идентификации подается изображение

- в виде матрицы целых чисел от 0 до 255, состоящей из h строк и w столбцов;

- яркость пикселя расположенном в i-й строке и j-м столбце изображения. Результатом работы алгоритма является номер класса объекта, который изображен на входном изображении.

Также имеется n классов объектов, которые необходимо идентифицировать:

где - множество всевозможных изображений объектов класса с номером . В этом случае возможна ситуация, когда во входном изображении имеется объект, не входящий в идентифицируемые множества. Тогда изображения, для которых алгоритм не сможет идентифицировать объекты, выделим в отдельный класс , а фактическое множество идентифицируемых классов объектов будет содержать класс:

Результатом работы алгоритма идентификации объекта изображения номер класса , для которого соблюдается

Установлено, что для задачи идентификации объектов изображений СНС имеют лучший показатель, исходя из соотношения «производительность - качество» и превосходят аналоги по качеству распознавания на 10 - 15%. Производительность метода скользящего окна, сильно зависит от свойств используемого алгоритма идентификации объектов изображения: уменьшение количества рассматриваемых окон позволяет повысить скорость детектирования объектов изображения.

Список литературы:

1. Алпатов Б.А., Бабаян П.В., Балашов О.Е., Степашкин А.И. Методы автоматического обнаружения и сопровождения объектов. Обработка изображений и управление. М.: Радиотехника, 2018. 176 с.

2. Антонов А.В., Никулин М.С. Статистические модели в теории надежности. Учебное пособие. М.: Абрис, 2012. С.389.

3. Бакут П. А., Колмогоров Г.С., Ворновицкий И. Э. Сегментация изображений: методы пороговой обработки // Зарубежная радиоэлектроника. № 10, 2016. С. 6-24.

4. Гансалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2015. С. 1012.

5. Гансалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. М.: Техносфера, 2016. С. 615.

6. Сойфер В. А. Методы компьютерной обработки изображений. М.: ФИЗМАТЛИТ, 2013. 784 с.

7. Колдаев В.Д. Использование графовых моделей для сегментации изображений. «Научное пространство Европы». 2014. C.35-38.

8. Колдаев В.Д. Агломеративные алгоритмы выделения инвариантных характеристик изображений. Научно-технический журнал «Известия высших учебных заведений. Электроника». Том21, №6,2016. С.566-573.

Алгоритмы распознавания объектов в видеопотоке

Похожие статьи