КОМПЬЮТЕРНОЕ ЗРЕНИЕ ДЛЯ АВТОМОБИЛЬНОЙ ИНДУСТРИИ
Журнал: Научный журнал «Студенческий форум» выпуск №19(286)
Рубрика: Технические науки
Научный журнал «Студенческий форум» выпуск №19(286)
КОМПЬЮТЕРНОЕ ЗРЕНИЕ ДЛЯ АВТОМОБИЛЬНОЙ ИНДУСТРИИ
COMPUTER VISION FOR THE AUTOMOTIVE INDUSTRY
Ali-Akbar Orozaliev
Student, Kazan State Energy University, Russia, Republic of Tatarstan, Kazan
T. Mukhametgaleev
Scientific adviser, Ph.D. tech. Sciences, Associate Professor, Kazan State Energy University, Russia, Republic of Tatarstan, Kazan
Аннотация. Этот статья представляет собой краткое введение в стереозрение и анализ движения для помощи водителю. Стереозрение и анализ движения играют важную роль в компьютерном зрении [2]. В последние годы в этой области были предложены и исследованы многие алгоритмы.
Abstract. This report provides a brief introduction into stereovision and motion analysis for driver assistance. Stereovision and motion analysis play a central role in computer vision [2]. Many algorithms in this field have been proposed and carefully studied.
Ключевые слова: робототехника, беспилотные автомобили, машинное зрение, конструкция, стереопара, эффективность, автоматизация, машинное обучение, технологии, камеры, промышленность.
Keywords: robotics, self-driving cars, computer vision, design, stereo pair, efficiency, automation, machine learning, technology, cameras, industry.
1. Стереопара и карты расстояний
В общих чертах, стереопара изображений позволяет идентифицировать пары соответствующих точек, а те позволяют рассчитать расстояние между проецируемой точкой в трехмерном мире и записывающими камерами.
Транспортное средство, которое используется для размещения платформы стереокамеры для захвата последовательностей стереоизображений, называется эго-транспортным средством.
После многих лет исследований по оценке эго-движений [1] автомобильная промышленность располагает всеми инструментами для создания исправленных (то есть геометрически скорректированных) последовательностей стереоизображений. Рассчитанные значения расстояний затем можно визуализировать на карте расстояний, где значения серого представляют различные уровни расстояний.
2. Анализ движения
Оценка движения для этих последовательностей должна предоставлять информацию о перемещениях объектов (скорость, траектория), соответствующую каждой последовательности, часто для определения возможных вариантов развития конфликта. Анализ движения в компьютерном зрении обычно начинается с расчета оптического потока [3], предполагая, что это приводит к приближенным расчетам локального смещения (соответствующих точек между двумя непрерывными кадрами изображения). Однако несколько экспериментов с этими последовательностями сразу же обнаружат сложность успешного применения алгоритмов оптического потока к этим последовательностям, которые часто размыты или имеют тонкую текстуру (например, на деревьях). Два типичных основных предположения, лежащих в основе алгоритмов оптического потока, заключаются в следующем: яркость сцены должна быть примерно постоянной, а локальные смещения должны быть небольшими. Однако часто эти требования трудновыполнимы. Например, освещенность часто меняется в одной последовательности из-за затенения деревьев, или даже есть разное освещение для левой и правой камеры. Объекты также часто очень быстро перемещаются внутри сегментов.
3. Анализ 6D
Объединение результатов стереоанализа и анализа движения (т. е. 3D плюс 3D, называемое в [4] 6D-видением) в одну последовательную интерпретацию сцены может позволить извлечь объекты и их движения.
Использование фильтрации Калмана рекомендуется для «сглаживания» и стабилизации движения извлеченных признаков, а также для получения более точных оценок.
Система координат камеры левая: если смотреть в направлении движения по оси Z, то ось X указывает вправо, а ось Y — на небо. Преобразование системы координат автомобиля в систему координат камеры представляет собой перевод, определяемый «latpos», высотой, расстоянием, за которым следует вращение, определяемое наклоном, рысканием и креном. Положительный наклон означает взгляд вниз, положительное рыскание означает взгляд вправо, а положительный крен означает движение по часовой стрелке.