Статья:

ИССЛЕДОВАНИЕ НОВЫХ МЕТОДОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ОБРАБОТКИ ИЗОБРАЖЕНИЙ

Конференция: LXI Студенческая международная научно-практическая конференция «Технические и математические науки. Студенческий научный форум»

Секция: Технические науки

Выходные данные
Блинов Р.В., Бычков К.В., Кирчева А.С. [и др.] ИССЛЕДОВАНИЕ НОВЫХ МЕТОДОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ОБРАБОТКИ ИЗОБРАЖЕНИЙ // Технические и математические науки. Студенческий научный форум: электр. сб. ст. по мат. LXI междунар. студ. науч.-практ. конф. № 5(61). URL: https://nauchforum.ru/archive/SNF_tech/5(61).pdf (дата обращения: 24.01.2025)
Лауреаты определены. Конференция завершена
Эта статья набрала 40 голосов
Мне нравится
Дипломы
лауреатов
Сертификаты
участников
Дипломы
лауреатов
Сертификаты
участников
на печатьскачать .pdfподелиться

ИССЛЕДОВАНИЕ НОВЫХ МЕТОДОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ОБРАБОТКИ ИЗОБРАЖЕНИЙ

Блинов Роман Викторович
студент, Сибирский государственный индустриальный университет, РФ, г. Новокузнецк
Бычков Кирилл Вячеславович
студент, Сибирский государственный индустриальный университет, РФ, г. Новокузнецк
Кирчева Алина Сергеевна
студент, Сибирский государственный индустриальный университет, РФ, г. Новокузнецк
Мамедов Илькин Вахид оглы
студент, Сибирский государственный индустриальный университет, РФ, г. Новокузнецк

 

Компьютерное зрение – это область искусственного интеллекта, которая занимается анализом и обработкой изображений. Одной из основных задач компьютерного зрения является распознавание объектов на изображениях. Для решения этой задачи используются методы глубокого обучения, которые позволяют создавать сложные нейронные сети, способные обрабатывать большие объемы данных и находить закономерности в них. Существующие методы глубокого обучения для распознавания объектов на изображениях имеют свои ограничения, такие как недостаточная точность, неэффективность или неспособность работать с разными типами объектов. В связи с этим исследователи и разработчики продолжают работать над созданием новых методов глубокого обучения для распознавания объектов на изображениях.

Для обучения таких нейронных сетей используются различные методы, такие как свёрточные нейронные сети, рекуррентные нейронные сети и генеративно-состязательные сети. Свёрточные нейронные сети используются для извлечения признаков из изображений, что позволяет увеличить точность распознавания объектов на изображениях. Рекуррентные нейронные сети используются для классификации объектов на изображениях, что позволяет учитывать контекст и последовательность объектов на изображении. Генеративно-состязательные сети используются для генерации новых изображений, что позволяет увеличить объем тренировочных данных и повысить точность распознавания объектов на изображениях.

Одним из примеров новых архитектур нейронных сетей для распознавания объектов на изображениях является Faster R-CNN. Эта архитектура использует свёрточные нейронные сети для извлечения признаков из изображений и рекуррентные нейронные сети для классификации объектов. Faster R-CNN показала высокую точность распознавания объектов на изображениях. Другой пример – это YOLO. Она использует одну сверточную нейронную сеть для обнаружения и классификации объектов на изображении. YOLO позволяет достичь высокой скорости распознавания объектов на изображениях. Еще одним примером является Mask R-CNN. Она расширяет архитектуру Faster R-CNN, добавляя возможность сегментации объектов на изображении. Mask R-CNN позволяет точно определять контуры объектов на изображении [1].

Компьютерное зрение играет важную роль в области медицины, так как позволяет автоматизировать процессы диагностики и обработки медицинских изображений. Для обнаружения опухолей на медицинских изображениях используются нейронные сети, которые обучаются на большом количестве медицинских изображений с различными типами опухолей. Нейронные сети позволяют автоматически обнаруживать опухоли на медицинских изображениях с высокой точностью и эффективностью. Другим примером является разработка алгоритмов для сегментации изображений. Она позволяет разделить медицинское изображение на отдельные области, такие как ткани или органы. Для сегментации изображений также используются нейронные сети, которые обучаются на большом количестве медицинских изображений с различными типами тканей и органов.

Распознавание жестов на видео является важной задачей в области компьютерного зрения, которая имеет множество практических применений. Одним из основных применений распознавания жестов на видео является управление умным домом, где жесты могут использоваться для управления различными устройствами, такими как свет, телевизор, кондиционер и прочее. Также распознавание жестов может использоваться в робототехнике для управления роботами, в медицине для диагностики и реабилитации пациентов, а также в различных играх и развлечениях. Для этого используются нейронные сети, которые обучаются на больших наборах данных жестов на видео, такие как 3D свёрточные нейронные сети, рекуррентные нейронные сети и гибридные модели. 3D свёрточные нейронные сети используются для извлечения признаков из видео, которые затем используются для классификации жестов. Рекуррентные нейронные сети используются для учета контекста и последовательности жестов на видео. Гибридные модели объединяют в себе сверточные и рекуррентные нейронные сети для более точного распознавания жестов на видео. Для улучшения точности и эффективности используются методы для устранения шума и улучшения качества видео, методы для улучшения обучения нейронных сетей на небольших наборах данных могут помочь увеличить эффективность распознавания жестов на видео при ограниченном количестве данных [2].

Одной из ключевых задач в области компьютерного зрения является анализ поведения людей на видео, который имеет разнообразные практические применения, включая обеспечение безопасности, маркетинг, управление производственными процессами и улучшение опыта покупателей. Однако, существующие методы имеют свои ограничения, такие как недостаточная точность, неспособность работать с различными типами поведения и ограниченные возможности работы с шумом и низким качеством видео. Для решения этих проблем исследователи и разработчики используют глубокое обучение, включая использование свёрточных и рекуррентных нейронных сетей для классификации поведения людей на видео. Для улучшения точности и эффективности используются различные методы, такие как машинное обучение для улучшения качества изображений и устранения шума, а также методы для улучшения обучения нейронных сетей на небольших наборах данных.

Еще одной важной задачей в разных областях, от производства до медицины, является автоматическая проверка качества. Целью этой задачи является повышение эффективности процессов и улучшение качества продукции. Для улучшения точности и эффективности автоматической проверки качества используются различные методы, такие как устранение шума и улучшение качества изображений. Кроме того, методы для улучшения обучения нейронных сетей на небольших наборах данных могут помочь увеличить эффективность автоматической проверки качества при ограниченном количестве данных. Дальнейшие исследования в области автоматической проверки качества могут быть направлены на улучшение точности работы с большими объемами данных и на разработку новых методов, которые будут учитывать различные типы дефектов и могут работать с различными типами изображений [3].

Автоматический анализ текстовых документов является важной задачей в разных областях, таких как лингвистика или маркетинг, и позволяет извлекать полезную информацию из больших объемов текстовых данных. Однако, существующие методы имеют некоторые ограничения, такие как недостаточную точность и неспособность работать с разными типами текста. Чтобы улучшить автоматический анализ текстовых документов, исследователи используют разные подходы, например, глубокое обучение на больших наборах данных. Это позволяет использовать нейронные сети для анализа текстов, используя различные архитектуры, такие как рекуррентные или сверточные нейронные сети. Для улучшения точности и эффективности автоматического анализа текстовых документов, используются разные методы, такие как предобработка текста или устранение шума. Также можно использовать методы для улучшения обучения нейронных сетей на небольших наборах данных. Дальнейшие исследования в области автоматического анализа текстовых документов могут быть направлены на улучшение работы с разными типами текстовых данных, таких как использование множества языков или сленга. Также можно разработать новые методы, которые будут учитывать разные типы текстовых данных и могут работать с большими объемами текста. В целом, развитие методов автоматического анализа текстовых документов является активной областью, которая имеет множество практических применений. Новые методы, основанные на глубоком обучении и других технологиях, могут помочь улучшить точность и эффективность автоматического анализа текстовых документов, что позволит использовать его для решения разных задач в разных областях.

Распознавание речи также является важной задачей, которая находит применение во многих областях, таких как транскрибирование, коммуникация и управление устройствами. Однако, существующие методы автоматического распознавания речи имеют свои ограничения, например, низкую точность при наличии шума или разных акцентов. Чтобы улучшить точность и эффективность распознавания речи, исследователи используют разные подходы, например, глубокое обучение на больших наборах аудиозаписей с различными акцентами, тембрами голоса и шумами. Для этого используются нейронные сети с разными архитектурами, такими как рекуррентные и сверточные нейронные сети. Для улучшения точности и эффективности автоматического распознавания речи, используются различные методы, например, методы фильтрации шума и улучшения аудиосигнала. Также методы обучения нейронных сетей на небольших наборах данных могут быть использованы для улучшения обучения и повышения точности распознавания речи на небольших наборах данных. Дальнейшие исследования в области автоматического распознавания речи могут быть направлены на улучшение работы с разными типами речевых данных, таких как различные языки и диалекты, а также на разработку новых методов, которые могут учитывать сленг и акценты. В целом, развитие методов автоматического распознавания речи является активной областью, которая имеет множество практических применений. Новые методы, основанные на глубоком обучении и других технологиях, могут помочь улучшить точность и эффективность распознавания речи, что позволит использовать его для решения разных задач в разных областях [4].

 

Список литературы:
1. Redmon, J., Divvala, S., Girshick, R., Farhadi, A. // You only look once: Unified, real-time object detection – 2016.
2. Manju Khari, Aditya Garg, Ruben Gonzalez Crespo, Elena Verdú // International Journal of Interactive Multimedia and Artificial Intelligence (Gesture Recognition of RGB and RGB-D static Images using Convolutional Neural Networks) – 2019
3. Yang Jing, Hao Dong // Materials (Using Deep Learning to Detect Defects in Manufacturing: A Comprehensive Survey and Current Challenges) – 2020
4. Li Deng, John C Platt, Allan Schmidt // Ensemble Deep Learning for Speech Recognition – 2019