Алгоритмы классификации объектов на изображениях приемной камеры современного фандомата

Ключевые слова: обработка изображений, фандоматы, сегментация изображений, машинное обучение, случайный лес, глубокое обучение, перенос обучения, аугментация данных, сверточные нейронные сети

Аннотация

В работе рассматривается задача разработки математического и программного обеспечения для анализа изображений в современных фандоматах. В рамках подхода, основанного на применении методов поверхностного машинного обучения, формулируется задача обработки изображений объектов, подлежащих сырьевой переработке в фандомате, как задача сегментации этих изображений с последующей классификацией по форме. Производится обзор и сравнение известных методов сегментации с целью выделения формы объектов и формирования признаков для классификации. В результате сравнения делается выбор в пользу метода активного контура. Предлагается и исследуется относительно простой алгоритм классификации сегментированных объектов на основе «случайного леса». Также предлагается два алгоритма выделения признаков классификации: алгоритм на основе анализа степени заполненности частей сегментированного изображения и алгоритм, вычисляющий свойства области объекта. Как альтернативный подход также описывается метод классификации получаемых изображений в целом, без предварительного выделения признаков, основанный на глубоком обучении. Обсуждается проблема дефицита обучающих данных, приводятся возможные подходы к её решению. Описывается реализация сверточной нейронной сети — классификатора с архитектурой DenseNet, полученная с применением техники переноса обучения. Представлены результаты экспериментов по оценке эффективности рассмотренных алгоритмов, проведенных на предоставленном обучающем наборе. Выбранный метод сегментации, а также оба рассмотренных классификатора продемонстрировали высокий уровень эффективности. Проведено сравнение результатов классификации для алгоритмов на основе поверхностного («случайный лес») и глубокого машинного обучения (сверточная нейронная сеть).

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Захар Сергеевич Гостев, Воронежский государственный университет

аспирант кафедры технологий обработки и защиты информации, факультета компьютерных наук, Воронежского государственного университета

Александр Анатольевич Сирота, Воронежский государственный университет

д-р техн. наук, проф., заведующий кафедрой технологий обработки и защиты информации, факультета компьютерных наук, Воронежского государственного университета

Литература

1. Volkova A. V. (2018) Rynok utilizatsii otkhodov – 2018 [Waste disposal market URL
2. Akhmetzyanov K. R. and Yuzhakov A. A. (2018) Sravnenie svertochnykh neironnykh setei dlya zadach sortirovki musornykh otkhodov [Comparison of convolutional neural networks for waste sorting tasks]. Izvestiya SPbGETU LETI. (6). P. 27–32. (in Russian)
3. González R. C., Woods R. E. and Masters B. R. (2009). Digital Image Processing, Third Edition. Journal of Biomedical Optics. 14. 029901.
4. Chow C. K. and Kaneko T. (1972). Automatic boundary detection of the left ventricle from cineangiograms. Computers and biomedical research, an international journal. 5(4). P. 388–410. DOI
5. Canny J. (1986). A computational approach to edge detection. IEEE transactions on pattern analysis and machine intelligence. 8(6). P. 679– 698.
6. Fu K. and Mui J. K. A survey on image segmentation. Pattern Recognit. 1981. P. 3–16.
7. Hojjatoleslami S. A. and Kittler J. (1998). Region growing: a new approach. IEEE transactions on image processing : a publication of the IEEE Signal Processing Society. 7(7). P. 1079–1084. DOI
8. Jianbo Shi and Malik J. (2000). Normalized cuts and image segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence. 22(8). P. 888–905. doi:10.1109/34.868688" target="_blank">DOI
9. Kass M., Witkin A. and Terzopoulos D. (1988) Snakes: Active contour models. Int J Comput Vision 1, P. 321–331. DOI
10. Breiman L. (1984). Classification and Regression Trees (1st ed.). Routledge. DOI
11. Louppe G. (2014). Understanding Random Forests: From Theory to Practice. arXiv: Machine Learning.
12. Shorten C. and Khoshgoftaar T. M. (2019). A survey on Image Data Augmentation for Deep Learning. Journal of Big Data. 6. P. 1–48.
13. Weiss K. R., Khoshgoftaar T. M. and Wang D. (2016). A survey of transfer learning. Journal of Big Data, 3.
14. Huang G., Liu Z., Van Der Maaten L. and Weinberger K. Q. (2017) Densely Connected Convolutional Networks. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, USA. P. 2261–2269. DOI
15. Uijlings J. R., Sande K. E., Gevers T. and Smeulders A. W. (2013). Selective Search for Object Recognition. International Journal of Computer Vision. 104. P. 154–171.
16. Dalal N. and Triggs B. (2005) Histograms of oriented gradients for human detection (2005). IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05), San Diego, CA, USA. vol. 1. P. 886–893. DOI
17. González R. C., Woods R .E. and Eddins S. L. (2006). Digital image processing using MATLAB.
18. Felzenszwalb P. F., Girshick R. B., McAllester D. and Ramanan D. (2010). Object detection with discriminatively trained part-based models. IEEE transactions on pattern analysis and machine intelligence. 32(9). P. 1627–1645. DOI
19. OpenCV command. (2015) OpenCV documentation index URL
Опубликован
2024-05-28
Как цитировать
Гостев, З. С., & Сирота, А. А. (2024). Алгоритмы классификации объектов на изображениях приемной камеры современного фандомата. Вестник ВГУ. Серия: Системный анализ и информационные технологии, (1), 114-126. https://doi.org/10.17308/sait/1995-5499/2024/1/114-126
Раздел
Интеллектуальные системы, анализ данных и машинное обучение

Наиболее читаемые статьи этого автора (авторов)