Abstract: Rhythmic gymnastics is a sport that is challenging for objective judging, where the accuracy of evaluating elements, especially dynamic elements involving a ball, depends significantly on subjective factors and judges’ fatigue. In this paper, an algorithm for automatic ball detection in video is proposed, based on a combination of a fine-tuned YOLOv8 detection model and the ByteTrack tracking algorithm. The model was fine-tuned on a custom dataset that accounts for domain-specific conditions, including small object size, motion blur, occlusions, and complex backgrounds. Experimental results demonstrate that the proposed algorithm achieves high detection accuracy (mAP@0.5 ≈ 0.99), as well as robustness to occlusions and stable object tracking, which makes it suitable as a foundation for developing automated evaluation systems in rhythmic gymnastics.
Keywords: rhythmic gymnastics, computer vision, object detection, object tracking, YOLOv8, ByteTrack, deep learning, sports analytics.
ВВЕДЕНИЕ
Художественная гимнастика (ХГ) представляет собой один из наиболее зрелищных и субъективно сложных видов спорта, в котором исполнение элементов требует от спортсменок не только исключительной физической подготовки, но и предельной точности координации движений. Оценка таких элементов осуществляется вручную квалифицированными судьями в соответствии с действующими правилами Международной федерации гимнастики (FIG), однако они испытывают значительные психофизические нагрузки в течение длительных соревнований, что неизбежно приводит к усталости, снижению концентрации и, как следствие, ошибкам и пропуску мелких, но критичных нарушений [1, 2].
Особую сложность для судейства представляют динамические элементы с мячом, характеризующиеся высокой скоростью, сложной траекторией и необходимостью синхронной оценки движений гимнастки и предмета. Для полноценной реализации задачи автоматизации оценки таких элементов первоначально необходимо научиться с высокой точностью обнаруживать координаты мяча на видео для последующей обработки.
ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ
Задачи детекции и отслеживания мяча представляют собой классическую проблему компьютерного зрения, связанную с обнаружением малогабаритных быстро движущихся объектов в условиях сложного фона, частичных окклюзий и изменяющегося освещения. В контексте художественной гимнастики эта задача усугубляется следующими факторами:
- Малый объект в кадре. При удалении камеры мяч может занимать в кадре мало пикселей.
- Быстрое движение и размытие. Высокие броски дают сильное смазывание на кадрах.
- Сильные окклюзии. Мяч часто перекрывается частями тела гимнастки на короткие интервалы.
- Ложные детекции. Соревновательная сцена и одежда гимнасток создают фоновые шумы, требующие робастной фильтрации.
- Высокие требования к точности для последующего анализа техники.
- Однокамерная система. В рамках данного исследования нет возможности работы с несколькими камерами.
Вместе с тем имеются и некоторые упрощения:
- Необходимость детекции только одного мяча и одной гимнастки.
- Невысокая скорость детектируемого объекта.
ОБЗОР ЛИТЕРАТУРЫ
В рамках решения задачи был проведен анализ современных компьютерных методов из источников, связанных преимущественно с детекцией мяча в спорте. Особое внимание уделялось подходам, обеспечивающим высокую точность и устойчивость в сложных условиях: при высокой скорости объекта, частичных перекрытиях, изменении освещения и сходстве с фоном.
Исторически первые решения основывались на классических алгоритмах компьютерного зрения, представленных на рисунке 1. Эти методы отличаются вычислительной простотой, однако обладают существенными ограничениями, принцип работы и ключевые ограничения некоторых из них отображены в таблице 1. Их эффективность критически снижается в динамичных сценах со сложным переменным освещением, наличием объектов-помех схожей цветовой гаммы и при сильном размытии. В частности, фильтры (Калмана, частиц), эффективные для линейного и предсказуемого движения, плохо адаптируются к резким нелинейным траекториям и изменению внешнего вида быстро движущегося мяча [3].
References
1. Boksem M. A. S., Meijman T. F., Lorist M. M. Effects of mental fatigue on attention: an ERP study //Cognitive brain research. – 2005. – Т. 25. – №. 1. – С. 107-116.2. Flessas K. et al. Judging the judges’ performance in rhythmic gymnastics //Medicine & Science in Sports & Exercise. – 2015. – Т. 47. – №. 3. – С. 640-648.
3. Kamble P. R., Keskar A. G., Bhurchandi K. M. Ball tracking in sports: a survey //Artificial Intelligence Review. – 2019. – V. 52. – N. 3. – P. 1655-1705.
4. Moreira C., Ferreira L., Coelho P. J. A comprehensive review of ball detection techniques in sports //PeerJ Computer Science. – 2025. – V. 11. – P. 3109.
5. Sapkota R., Karkee M. Ultralytics YOLO Evolution: An Overview of YOLO26, YOLO11, YOLOv8 and YOLOv5 Object Detectors for Computer Vision and Pattern Recognition //arXiv preprint arXiv:2510.09653. – 2025.
6. Jeong J., Park H., Kwak N. Enhancement of SSD by concatenating feature maps for object detection //arXiv preprint arXiv:1705.09587. – 2017.
7. Liu W. et al. Ssd: Single shot multibox detector //European conference on computer vision. – Cham : Springer International Publishing, 2016. – С. 21-37.
8. Ren S. et al. Faster r-cnn: Towards real-time object detection with region proposal networks //Advances in neural information processing systems. – 2015. – Т. 28.
9. He K. et al. Mask r-cnn //Proceedings of the IEEE international conference on computer vision. – 2017. – С. 2961-2969.
10. Buric M., Pobar M., Ivasic-Kos M. Ball detection using YOLO and Mask R-CNN //2018 International conference on computational science and computational intelligence (CSCI). – IEEE, 2018. – P. 319-323.
11. Lin T. Y. et al. Focal loss for dense object detection //Proceedings of the IEEE international conference on computer vision. – 2017. – P. 2980-2988.
12. Zhang Y. et al. Bytetrack: Multi-object tracking by associating every detection box //European conference on computer vision. – Cham : Springer Nature Switzerland, 2022. – С. 1-21.
13. Aharon N., Orfaig R., Bobrovsky B. Z. BoT-SORT: Robust associations multi-pedestrian tracking //arXiv preprint arXiv:2206.14651. – 2022.
14. Cao J. et al. Observation-centric sort: Rethinking sort for robust multi-object tracking //Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. – 2023. – С. 9686-9696.
15. Ultralytics YOLOv8 Documentation [Электронный ресурс] : [официальная документация] / Ultralytics. – 2023. – URL: https://docs.ultralytics.com/ru/models/yolov8/#performance-metrics (дата обращения: 06.01.2026).
16. Журавлёв А. К., Григорян К. А. Автоматическая разметка обучающих выборок в компьютерном зрении с использованием методов машинного обучения //Электронные библиотеки. – 2024. – Т. 27. – №. 5. – С. 718-729.
17. Shorten C., Khoshgoftaar T. M. A survey on image data augmentation for deep learning //Journal of big data. – 2019. – Т. 6. – №. 1. – С. 1-48.
