Улучшение метода Виолы-Джонса при помощи комбинирования с методом Camshift
Конференция: CXXXIII Студенческая международная научно-практическая конференция «Молодежный научный форум»
Секция: Технические науки
CXXXIII Студенческая международная научно-практическая конференция «Молодежный научный форум»
Улучшение метода Виолы-Джонса при помощи комбинирования с методом Camshift
В современном информационном пространстве существует большое количество разработанных методов выделения и распознавания человеческого лица в цифровом видеосигнале для систем безопасности. Развитие данной области получило массовое распространение еще в конце 50-х годов. Разработками в данной области занимались многие отечественные ученые: Айвазян С.А., Айзерман М.А., Бонгард М.М., Вапник В.Н. и др..
Несмотря на прошедшие годы разработки данного вопроса, его актуальность все еще высока и обусловливается современными требованиями в области обработки видеосигналов в системах безопасности. По состоянию на сегодняшний день необходимость в цифровой обработке видеосигналов велика, поскольку существует большой нерешенный спектр задач, связанный с распознаванием видеосигналов на фоне общего потока видеоинформации, таких как частота распознавания человеческих лиц, распознавание лиц в условиях плохой освещенности, повышение точности распознавания лица по его части, высокая вычислительная трудоемкость.
В результате анализа научной литературы для решения задачи детектирования и распознавания человеческого лица в цифровом видеосигнале было принято решение улучшить метод Виолы-Джонса, повысив точность и устранив основной недостаток – невозможность распознавания лиц при углах наклона и поворота больше 30°. Было принято решение реализовать данное улучшение при помощи комбинирования данного метода с методом Camshift.
Нами было выдвинуто предположение о том, что найденное с помощью метода Виолы-Джонса лицо можно продолжать отслеживать по тону кожи независимо от угла поворота и наклона, что реализуется методом Camshift. Это предположение в теории может устранить основной недостаток метода Виолы-Джонса.
В качестве инструмента для реализации модернизации метода нами было решено использовать высокоуровневый язык программирования общего назначения Python 3. Такой выбор обусловлен наличием большого количества готовых решений в виде подключаемых библиотек, а также относительной простоты языка Python. Python является кроссплатформенным языком программирования с большим сообществом разработчиков.
Эксперименты по детектированию лица проводились при дневном и ночном освещении. Метод Виолы-Джонса справляется с детектированием лиц в рамках своих ограничений, а алгоритм Camshift демонстрирует себя достаточно плохо. Однако стоит отметить, что в ночных условиях при наличии небольшого источника искусственного освещения ложные срабатывания алгоритма Camshift были не столь велики как при наличии дневного освещения.
В ходе проведенных экспериментов было обнаружено, что главный недостаток метода Camshift – сильная зависимость от цвета детектируемого объекта – является критичным при соблюдении определённых условий. Условия тестирования были таковыми, что цвет фона был близок к цвету лиц людей европеоидной расы. Это привело к тому, что метод Camshift часто неправильно распознавал объекты. Небольшое изменение тона заставляло его хаотично переключаться между элементами фона и лица.
Таким образом можно сделать вывод о том, что его использование нерационально из-за того, что для каждой камеры, выбравшей в качестве метода детектирования лица в сложной обстановке (цвет фона близок к цвету лица) сочетание методов Виолы-Джонса и Camshift, придётся проводить тонкую настройку своего диапазона HSV цветов для детектирования человеческих лиц. Этот диапазон будет очень зависеть от окружающих распознаваемый объект фоновых цветов. Более того тонкая настройка этого диапазона приведёт к невозможности отслеживания лиц, тон которых отличен от полученного в результате настройки.
Следовательно, люди, обладающие загаром и не обладающие таковым будут детектироваться с разной точностью, которая может иметь недопустимо большую величину разброса.
В результате эксперимента было выяснено, что детектирование лиц нескольких рас одновременно с помощью алгоритма Camshift при наличии сложного фона, схожего с цветом лиц детектируемых людей, является невозможным.
Алгоритм Camshift требует явно различимые цвета детектируемого объекта и его фона.
Подводя итог, можно сделать вывод о том, что распознавание лиц в сложной обстановке – когда цвет лица близок к цвету окружения, с помощью модифицированного метода сильно затруднено. Метод часто выдаёт ложные срабатывания.
Для использования метода нужна четкая настройка на определённое освещение и определённый цвет кожи людей. В ходе исследования было выявлено, что данный метод находит крайне узкое применение для распознавания человеческих лиц, поскольку изменение внешнего освещения в течении дня и различный тон кожи людей разных рас и национальностей приводит к потере человеческого лица и ложному детектированию.