Применение трансформерных архитектур для семантической классификации медицинских заключений на русском языке

Дата публикации: 13.11.2025

Применение трансформерных архитектур для семантической классификации медицинских заключений на русском языке

Айвазов А.Г.
Аннотация: В данной работе рассматривается применение трансформерных архитектур для семантической классификации медицинских заключений, составленных на русском языке. Цель исследования – разработка алгоритма, позволяющего автоматически классифицировать пациентов с различными формами артрита (коды МКБ: M08.0, M08.1, M08.3, M08.4) на основе анализа текстовых медицинских данных. Для построения векторных представлений используется модель embeddinggemma. Проведено сравнение эффективности классификаторов, включая логистическую регрессию и метод опорных векторов (SVM). Полученные результаты демонстрируют, что предложенный подход обеспечивает качество классификации, существенно превосходящее случайное угадывание, и может служить основой для дальнейшей автоматизации поддержки клинических решений.
Ключевые слова: трансформер, искусственный интеллект, классификация, эмбеддинги, медицинские тексты, ювенильный артрит, машинное обучение.
Полный текст статьи