Статья:

Автоматическое обнаружение лесоматериалов на цифровых изображениях с помощью ансамбля решающих деревьев

Конференция: VI Международная заочная научно-практическая конференция "Научный форум: технические и физико-математические науки"

Секция: Информатика, вычислительная техника и управление

Выходные данные
Завада С.Г. Автоматическое обнаружение лесоматериалов на цифровых изображениях с помощью ансамбля решающих деревьев // Научный форум: Технические и физико-математические науки: сб. ст. по материалам VI междунар. науч.-практ. конф. — № 5(6). — М., Изд. «МЦНО», 2017. — С. 55-60.
Конференция завершена
Мне нравится
на печатьскачать .pdfподелиться

Автоматическое обнаружение лесоматериалов на цифровых изображениях с помощью ансамбля решающих деревьев

Завада Светлана Григорьевна
магистрант, Уральский федеральный университет, РФ, г. Екатеринбург

 

Automatic detection of timber on digital images with decision trees and ensemble learning

 

Svetlana Zavada

graduate student, Ural Federal University, Russia, Ekaterinburg

 

Аннотация. В статье рассматривается задача автоматического обнаружения торцов круглых лесоматериалов на изображениях. В работе делается обзор существующих методов по данной тематике и предлагается алгоритм детектирования, развивающий ранее предложенный подход на основе гистограммы направленных градиентов, использующий в качестве классификатора алгоритм обучения случайных решающих деревьев. Приведены результаты исследования и настройки предложенного детектора.

Abstract. The paper discusses the problem of detection of piled logs based on digital image processing. This task is a very important in woodworking industry. This paper gives a survey of existing methods, shows highs and lows of these approaches, and presents a new algorithm which extends previously proposed method based on the histogram of oriented gradients and random decision forests classifier. To assess quality of recognition, paper gives the results of the research of the detector.

 

Ключевые слова: машинное обучение, лесоматериалы, гистограмма направленных градиентов, изображение

Keywords: machine learning, round wood, histogram of oriented gradients, image.

 

Автоматизация учета сырья и готовой продукции является важной задачей в самых различных областях промышленности и имеет большое значение для формирования полной и достоверной информации о наличии, движении и сохранности производственных запасов на любом предприятии. Особенно актуальна эта задача в лесозаготовительной и деревообрабатывающей отрасли, где одной из важнейших технологических операций по учету является измерение геометрических характеристик лесо- и пиломатериалов. В настоящее время разработано достаточно большое количество методов учета круглых лесоматериалов. При этом наиболее распространены ручные методы измерений, когда операции контроля выполняет непосредственно человек. Особенностью такого подхода является высокая трудоемкость и значительная погрешность измерения объемов - более 15% [4], что приводит к занижению или завышению реального объема продукции, недостачам при расчетах между поставщиками и покупателями леса, и как следствие к экономическим убыткам предприятий. Всех этих недостатков могут быть лишены бесконтактные методы измерения на основе технического зрения, когда положение, форма и размеры срезов определяются специализированным программным обеспечением по их фотоизображениям, и при известной номинальной длине бревен в соответствии с принятой моделью (усеченного конуса или цилиндра) вычисляется объем. Существующие системы оценки качественных и количественных характеристик круглых лесоматериалов на изображениях сталкиваются с множеством проблем: перекрытиями срезов стволов, деформацией формы, малым размером бревен на изображениях, низким качеством входных данных и различными условиями съемки. В связи с этим точные методы оценки круглого леса, которые можно было бы применять практически, в настоящее время отсутствуют. Большинство систем построено на основе распознавания объектов, что позволяет учитывать отдельные бревна в штабеле. Однако из этого свойства следует и недостаток данных методов – их эффективность зависит от того, насколько надежно удается детектировать каждое наблюдаемое бревно. В силу указанных ранее проблем такие ограничения надежности пока не удается преодолеть полностью, поэтому в большинстве подобных систем помимо автоматического обнаружения предусмотрен ручной режим редактирования результатов измерения [1; 2]. Альтернативным подходом является определение объема штабеля исходя из процента заполненного бревнами пространства на изображении, с учетом геометрического размера данной области и оценки количества бревен, которое может поместиться на данном участке изображения [6]. Алгоритмы, основанные на таком подходе, не обеспечивают локализации отдельных объектов и применимы лишь для определения складочного объёма штабеля по правилу «полного ящика» с учетом коэффициента полнодревесности.

В данной работе рассматривается подход, основанный на машинном обучении. Для этого предлагается применить метод из статьи [7]. В указанной работе реализован классический HOG-детектор, использующий в качестве классификатора метод опорных векторов (англ. SVM - support vector machine). В данной работе используется алгоритм обучения случайных решающих деревьев (англ. Random Forest) [5]. Для оценивания его обобщающей способности используется k-блочная кросс-проверка [9]. Данный метод дает несмещенную оценку вероятности ошибки, а значит, позволяет обнаружить переобучение классификатора. В качестве обучающей выборки в работе используются изображения штабелей бревен из набора HAWKwood [8]. Для экспериментов используются 18406 изображений с 9476 «положительными» снимками бревен и 8930 изображений с «отрицательными» образцами.

В первом эксперименте были рассмотрены несколько вариантов построения детекторов в зависимости от масштаба обучающей выборки. В общей сложности, модели были обучены и протестированы с 9 наборами масштабированных версий одних и тех же изображений. Для каждого набора рассчитывались показатели (полнота, точность и F-метрика), зависящие от коэффициента заполнения, который равен отношению площади ограничивающего прямоугольника бревна к площади изображения (рис. 1а).

Из результатов первого эксперимента было установлено, что масштаб изображений, на котором достигается максимум полноты и точности классификатора, соответствует размеру области изображения бревна с коэффициентом заполнения 35% (рис. 1б).

 

Рисунок 1. Оценка детекторов бревен а) изображения бревен при различных масштабах б) метрики качества

 

В рамках второго эксперимента были исследованы результаты работы классификаторов, обученных на шести различных наборах HOG-дескрипторов. Визуализация качества работы классификаторов представлена кривыми компромиссного определения ошибки (англ. DET - detection error trade-off). Анализ кривых рисунка 2 показывает, что наиболее близко к началу системы координат (левому нижнему углу) расположены точки, соответствующие дескриптору с 9 каналами гистограммы и размером окна 64 пикселя (HOG64-9).

 

Рисунок 2. Кривые компромиссного определения ошибки

 

Это означает, что классификатор с таким дескриптором обладает наилучшей предсказательной способностью. Такой классификатор способен обнаруживать бревна с вероятностью 99.3% при уровне ложного срабатывания 1,1%.

Полученные результаты позволяют сделать вывод о возможности применения описанной разработки в качестве элемента системы автоматического учета лесоматериалов. Вместе с тем в работе удалось существенно улучшить предложенный алгоритм по сравнению с работой [3] за счет настройки детектора, когда эмпирическим путем был подобран характеристический размер бревен, на котором достигается максимум полноты и точности распознавания (рис. 1). Иллюстрация работы детектора приведена на рисунке 3.

 

Рисунок 3. Детектирование бревен из набора KAWKwood

 

Дальнейшее развитие исследований, представленных в работе, будет связано с построением эффективных алгоритмов оконтуривания объектов интереса и пиксельной сегментации бревен.

 

Список литературы:
1. Жеребин А.М., Воскобойников И.В., Щелоков В.М. Анализ применимости оптических методов измерений для автоматизированного учета круглых лесоматериалов // Вестник МГУЛ – Лесной вестник. 2012. №8 (91). С.19–22.
2. Круглов А.В., Югфельд И.Д. Реализация интерактивной сегментации для сенсорных устройств на базе ОС Android // Современные наукоемкие технологии. – 2016. – № 2-2. – С. 229–234.
3. Чирышев Ю.В., Атаманова А.С. Распознавание круглых лесоматериалов с помощью случайных решающих деревьев и гистограммы направленных градиентов // Фундаментальные исследования. – 2017. – № 1. – С. 124–128.
4. Knyaz V.A., Maksimov A.A. Photogrammetric Technique for Timber Stack Volume Contol // International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Vol. XL-3, 157–162, 2014.
5. Breiman L. Random forests // Machine Learning, 45(1): 5–32, 2001. 
6. Dahl A.B., Guo M., Madsen K.H. Scale-space and watershed segmentation for detection of wood logs // in: Vision Day, Informatics and Mathematical Modelling 2006.
7. Dalal N., Triggs B. Histograms of oriented gradients for human detection // IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05), San Diego, CA, USA, 2005, pp. 886-893 vol. 1.
8. Herbon С. The HAWKwood Database // eprint arXiv:1410.4393.
9. Mullin M., Sukthankar R. Complete Cross-Validation for Nearest Neighbor Classifiers // Proceedings of International Conference on Machine Learning. 2000. С. 1137–1145.