Автоматическое распознавание автомобильных номеров в видеоряде: адаптация алгоритмов для смартфона

Ключевые слова: распознавание автомобильных номеров, алгоритмы распознавания, распознавание на смартфоне, распознавание номеров

Аннотация

В данной области уже проведено немало исследований, и предложены различные модели, решающие задачу распознавания автомобильных номеров, есть промышленные образцы, используемые на камерах фиксации нарушений правил дорожного движения. Однако, такие модели обычно разработаны для клиент-серверных архитектур, поскольку архитектуры моделей, хорошо решающих данную задачу, зачастую имеют сотни миллионов параметров [5] и рассчитаны для того, чтобы их обучали и применяли на машинах с большим объемом памяти и производительными видеокартами. Предметом исследования данной статьи являются автомобильные государственные номерные знаки в видеоряде плохого качества, распознаваемые в условиях ограничения на вычислительные ресурсы. Для распознавания автомобильных номеров предлагается использовать следующие методы: простые сверточные нейронные сети для определения углов таблички автомобильного номера и ее последующего поворота; предобученная модель YOLOv5s для поиска в кадре табличек автомобильных номеров и предобученная сеть SCR-Net для распознавания на табличках номерных знаков. В статье предложены алгоритм и его реализация для автоматического распознавания автомобильного номера в условиях видео плохого качества и ограниченности вычислительных ресурсов. Теоретическая значимость результата заключается в разработке нового алгоритма, учитывающего указанные ограничения, способствующего развитию серии изысканий в области разработки методов и алгоритмов, функционирующих в условиях существенных ограничений на вычислительные мощности и качество видеоряда. Практическая значимость результата заключается в приложениях результата к решению прикладных задач, таких как фиксация неправильной парковки, поиск угоняемых автомобилей, иных правонарушений.

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Максим Викторович Абрамов, Санкт-Петербургский Федеральный исследовательский центр Российской академии наук

канд. техн. наук, старший научный сотрудник, руководитель лаборатории теоретических и междисциплинарных проблем информатики, Санкт-Петербургский Федеральный исследовательский центр Российской академии наук; доцент кафедры информатики, Санкт-Петербургский государственный университет

Даниил Андреевич Ельцов, Huawei Technologies Co. Ltd

инженер по исследованиям и разработкам в команде облачных игр, Huawei Technologies Co. Ltd

Литература

1. Geirhos R., Janssen D. H. J., Schütt H. H., Rauber J., Bethge M., Wichmann F. A. (2017) Comparing deep neural networks against humans: object recognition when the signal gets weaker // arXiv preprint arXiv:1706.06969. URL
2. Олисеенко В. Д., Абрамов М. В., Тулупьев А. Л. (2021) Идентификация аккаунтов пользователей при помощи сравнения изображений: подход на основе pHash. Научно-технический вестник информационных технологий, механики и оптики. Т. 21, No 4. P. 562–570. DOI
3. Корепанова А. А., Абрамов М. В., Тулупьев А. Л. (2021) Идентификация аккаунтов пользователей социальных сетей при помощи сравнения графического контента. Научно-технический вестник информационных технологий, механики и оптики. Т. 21, No 6. P. 942–950. DOI
4. Oliseenko V. D., Abramov M. V. (2021) Identification of user profiles in online social networks: a combined approach with face recognition. Journal of Physics: Conference Series. Vol. 1864. 012119. DOI
5. Shahdadpuri N. Real Image of Computer Vision Application and its Impact: Future and Challenges. URL
6. Wang Y., Bian Z.-P., Zhou Y., Chau L.-P. (2021) Rethinking and designing a high-performing automatic license plate recognition approach. IEEE Transactions on Intelligent Transportation Systems. URL
7. Du S., Ibrahim M., Shehata M. (2012) Automatic license plate recognition (ALPR): A stateof-the-art review. IEEE Transactions on circuits and systems for video technology. Т. 23, No 2. P. 311–325. URL
8. He K., Zhang X., Ren S., Sun J. (2016) Deep residual learning for image recognition. Proceedings of the IEEE conference on computer vision and pattern recognition. P. 770–778. URL
9. Saha S., Basu S., Nasipuri M., Basu D. K. (2011) Localization of License Plates from Indian Vehicle Images Using Iterative Edge Map Generation. URL
10. Laroca R., Severo E., Zanlorensi L. A., Oliveira L. S., Goncalves G. R., Schwartz W. R., Menotti D. (2018) A robust real-time automatic license plate recognition based on the YOLO detector . 2018 international joint conference on neural networks (ijcnn). IEEE. P. 1–10. URL
11. Ren S., He K., Girshick R., Sun J. (2015) Faster r-cnn: Towards real-time object detection with region proposal networks. Advances in neural information processing systems. Т. 28. URL
12. Vaswani A., Shazeer A., Parmar N., Uszkoreit J., Jones L., Gomez A.N., Kaiser L., Polosukhin I. (207) Attention is all you need. Advances in neural information processing systems. Т. 30. URL
13. Liu W., Anguelov D., Erhan D., Szegedy C., Reed S., Fu C-Y., Berg A. C. (2016) Ssd: Single shot multibox detector. European conference on computer vision. Springer, Cham. P. 21–37. URL
14. Redmon J., Divvala S., Girshick R., Farhadi A. (2016) You only look once: Unified, real-time object detection. Proceedings of the IEEE conference on computer vision and pattern recognition. P. 779–788. URL
15. Zhu X., Lyu S., Wang X., Zhao Q. (2021) TPH-YOLOv5: Improved YOLOv5 based on transformer prediction head for object detection on drone-captured scenarios. Proceedings of the IEEE/CVF International Conference on Computer Vision. P. 2778–2788. URL
16. Smith R. (2007) An overview of the Tesseract OCR engine. Ninth international conference on document analysis and recognition (ICDAR 2007). IEEE. Т. 2. P. 629–633. URL
17. Wang W., Yang J., Chen M., Wang P. (2019) A light CNN for end-to-end car license plates detection and recognition. IEEE Access. Т. 7. P. 173875–173883. – URL
18. Zhuang J., Hou S., Wang Z., Zha Z.-J. (2018) Towards human-level license plate recognition. Proceedings of the European Conference on Computer Vision (ECCV). P. 306–321. URL
19. Wang Y., Bian Z.-P., Hou J., Chau L.- P. (2020) Convolutional neural networks with dynamic regularization. IEEE Transactions on Neural Networks and Learning Systems. Т. 32, No 5. P. 2299–2304. URL
20. YOLOv5 Github. URL
21. Ioffe S., Szegedy C. (2015) Batch normalization: Accelerating deep network training by reducing internal covariate shift. International conference on machine learning. PMLR, P. 448–456. URL
22. Agarap A. F. (2018) Deep learning using recti-fied linear units (relu) // arXiv pre- print arXiv:1803.08375. URL
23. Tompson J., Goroshin R., Jain A., LeCun Y., Bregler C. (2015) Efficient object localization using convolutional networks. Proceedings of the IEEE conference on computer vision and pattern recognition. P. 648–656. URL
Опубликован
2023-10-26
Как цитировать
Абрамов, М. В., & Ельцов, Д. А. (2023). Автоматическое распознавание автомобильных номеров в видеоряде: адаптация алгоритмов для смартфона. Вестник ВГУ. Серия: Системный анализ и информационные технологии, (3), 95-106. https://doi.org/10.17308/sait/1995-5499/2023/3/95-106
Раздел
Интеллектуальные системы, анализ данных и машинное обучение