Статья:

КОМПЬЮТЕРНОЕ ЗРЕНИЕ ДЛЯ АВТОМОБИЛЬНОЙ ИНДУСТРИИ

Журнал: Научный журнал «Студенческий форум» выпуск №19(286)

Рубрика: Технические науки

Выходные данные
Орозалиев А.К. КОМПЬЮТЕРНОЕ ЗРЕНИЕ ДЛЯ АВТОМОБИЛЬНОЙ ИНДУСТРИИ // Студенческий форум: электрон. научн. журн. 2024. № 19(286). URL: https://nauchforum.ru/journal/stud/286/149029 (дата обращения: 04.01.2025).
Журнал опубликован
Мне нравится
на печатьскачать .pdfподелиться

КОМПЬЮТЕРНОЕ ЗРЕНИЕ ДЛЯ АВТОМОБИЛЬНОЙ ИНДУСТРИИ

Орозалиев Али-Акбар Кемельевич
студент, Казанский государственный энергетический университет, РФ, Республика Татарстан, г. Казань
Мухаметгалеев Танир Хамитович
научный руководитель, канд. техн. наук, доцент, Казанский государственный энергетический университет, РФ, Республика Татарстан, г. Казань

 

COMPUTER VISION FOR THE AUTOMOTIVE INDUSTRY

 

Ali-Akbar Orozaliev

Student, Kazan State Energy University, Russia, Republic of Tatarstan, Kazan

T. Mukhametgaleev

Scientific adviser, Ph.D. tech. Sciences, Associate Professor, Kazan State Energy University, Russia, Republic of Tatarstan, Kazan

 

Аннотация. Этот статья представляет собой краткое введение в стереозрение и анализ движения для помощи водителю. Стереозрение и анализ движения играют важную роль в компьютерном зрении [2]. В последние годы в этой области были предложены и исследованы многие алгоритмы.

Abstract. This report provides a brief introduction into stereovision and motion analysis for driver assistance. Stereovision and motion analysis play a central role in computer vision [2]. Many algorithms in this field have been proposed and carefully studied.

 

Ключевые слова: робототехника, беспилотные автомобили, машинное зрение, конструкция, стереопара, эффективность, автоматизация, машинное обучение, технологии, камеры, промышленность.

Keywords: robotics, self-driving cars, computer vision, design, stereo pair, efficiency, automation, machine learning, technology, cameras, industry.

 

1. Стереопара и карты расстояний

В общих чертах, стереопара изображений позволяет идентифицировать пары соответствующих точек, а те позволяют рассчитать расстояние между проецируемой точкой в ​​трехмерном мире и записывающими камерами.

Транспортное средство, которое используется для размещения платформы стереокамеры для захвата последовательностей стереоизображений, называется эго-транспортным средством.

После многих лет исследований по оценке эго-движений [1] автомобильная промышленность располагает всеми инструментами для создания исправленных (то есть геометрически скорректированных) последовательностей стереоизображений. Рассчитанные значения расстояний затем можно визуализировать на карте расстояний, где значения серого представляют различные уровни расстояний.

2. Анализ движения

Оценка движения для этих последовательностей должна предоставлять информацию о перемещениях объектов (скорость, траектория), соответствующую каждой последовательности, часто для определения возможных вариантов развития конфликта. Анализ движения в компьютерном зрении обычно начинается с расчета оптического потока [3], предполагая, что это приводит к приближенным расчетам локального смещения (соответствующих точек между двумя непрерывными кадрами изображения). Однако несколько экспериментов с этими последовательностями сразу же обнаружат сложность успешного применения алгоритмов оптического потока к этим последовательностям, которые часто размыты или имеют тонкую текстуру (например, на деревьях). Два типичных основных предположения, лежащих в основе алгоритмов оптического потока, заключаются в следующем: яркость сцены должна быть примерно постоянной, а локальные смещения должны быть небольшими. Однако часто эти требования трудновыполнимы. Например, освещенность часто меняется в одной последовательности из-за затенения деревьев, или даже есть разное освещение для левой и правой камеры. Объекты также часто очень быстро перемещаются внутри сегментов.

3. Анализ 6D

Объединение результатов стереоанализа и анализа движения (т. е. 3D плюс 3D, называемое в [4] 6D-видением) в одну последовательную интерпретацию сцены может позволить извлечь объекты и их движения.

Использование фильтрации Калмана рекомендуется для «сглаживания» и стабилизации движения извлеченных признаков, а также для получения более точных оценок.

Система координат камеры левая: если смотреть в направлении движения по оси Z, то ось X указывает вправо, а ось Y — на небо. Преобразование системы координат автомобиля в систему координат камеры представляет собой перевод, определяемый «latpos», высотой, расстоянием, за которым следует вращение, определяемое наклоном, рысканием и креном. Положительный наклон означает взгляд вниз, положительное рыскание означает взгляд вправо, а положительный крен означает движение по часовой стрелке.

 

Список литературы:
1. H. Badino // A robust approach for ego-motion estimation using a mobile stereo platform // In Proc. Int. Workshop Complex Motion, pages 198–208, LNCS 3417, Springer, Berlin, 2006.
2. S. Baker, D. Scharstein, J. P. Lewis, S. Roth, M. J. Black, and R. Szeliski // A database and evaluation methodology for optical flow // In Proc. Int. Conf. Computer Vision, to appear, 2007
3. B. K. P. Horn and B. G. Schunck // Determining optical flow // Artificial Intelligence, 17:185–203, 1981.
4. U. Franke, C. Rabe, H. Badino, and S. Gehrig // 6D-vision - fusion of stereo and motion for robust environment perception // In Proc. DAGM, pages 216–223, 2005.