Аннотация: В данной работе рассматривается применение трансформерных архитектур для семантической классификации медицинских заключений, составленных на русском языке. Цель исследования – разработка алгоритма, позволяющего автоматически классифицировать пациентов с различными формами артрита (коды МКБ: M08.0, M08.1, M08.3, M08.4) на основе анализа текстовых медицинских данных. Для построения векторных представлений используется модель embeddinggemma. Проведено сравнение эффективности классификаторов, включая логистическую регрессию и метод опорных векторов (SVM). Полученные результаты демонстрируют, что предложенный подход обеспечивает качество классификации, существенно превосходящее случайное угадывание, и может служить основой для дальнейшей автоматизации поддержки клинических решений.
Ключевые слова: трансформер, искусственный интеллект, классификация, эмбеддинги, медицинские тексты, ювенильный артрит, машинное обучение.
Статья в сборнике научных трудов по материалам конференции (форума) «Современные тенденции в науке, искусстве и технологии: междисциплинарные перспективы»
