Data science in medicine

UDC 04
Publication date: 29.06.2023
International Journal of Professional Science №6-2023

Data science in medicine

Data science в медицине

Koshkina A.E.
Pronkin N.N.
1. Sechenov First Moscow state medical University of the Ministry of health of the Russian Federation, 3th Grade.
2. PhD, associate Professor – Sechenov First Moscow state medical University of the Ministry of health of the Russian Federation (Sechenov University).

Кошкина А.Э.
Пронькин Н.Н.
1. ФГАОУ ВО Первый Московский государственный медицинский университет имени И.М. Сеченова Министерства здравоохранения Российской Федерации (Сеченовский Университет), 3 курс.
2. к.э.н, доцент – ФГАОУ ВО Первый Московский государственный медицинский университет имени И.М. Сеченова Министерства здравоохранения Российской Федерации (Сеченовский Университет).
Аннотация: Данная статья посвящена описанию текущего состояния Data Science в области здравоохранения и фармакологии. В статье дается представление о состоянии аналитики больших данных в текущее время, выделяются преимущества, описываются используемые фреймворки и методы, излагаются возможности и перспективы использования Big Data в сфере здравоохранения.

Abstract: This article is devoted to describing the current state of Data Science in the field of healthcare and pharmacology. The article gives an idea of the state of big data analytics at the current time, highlights the benefits, describes the frameworks and methods used, outlines the possibilities and prospects for using Big Data in healthcare.
Ключевые слова: большие данные; наука о данных; анализ больших данных в медицине; информация о системе здравоохранения.

Keywords: big data; data science; big data analysis in medicine; information about the healthcare system.


Распространение больших данных во всех сферах жизни, от торговли до транспорта, заставляет осознать, насколько они незаменимы в повседневной жизни. Точно так же большие данные преобразовывают медицинский сектор, коренным образом меняя то, как проводятся основные процедуры мониторинга здоровья, а также формируя и отображая неструктурированную информацию. Data Science и Big Data Analytics могут дать практическую информацию и помочь в принятии стратегических решений, касающихся системы здравоохранения. Это помогает создать комплексное представление о пациентах, потребителях и врачах. Принятие решений на основе данных открывает новые возможности для повышения качества здравоохранения.

В наши дни науку о данных делает незаменимой для здравоохранения ряд факторов, наиболее важным из которых является конкурентный спрос на ценную информацию на рынке здравоохранения. Сбор данных о пациентах по надлежащим каналам может помочь повысить качество медицинских услуг для потребителей. От врачей до поставщиков медицинских страховок и учреждений — все они полагаются на сбор фактических данных и их точный анализ для принятия обоснованных решений о состоянии здоровья пациентов.

В настоящее время заболевания можно прогнозировать на самой ранней стадии с помощью Data Science в здравоохранении, а также дистанционно с помощью инновационных устройств на основе машинного обучения. Мобильные приложения и интеллектуальные устройства постоянно собирают данные о частоте сердечных сокращений, артериальном давлении, сахаре и т. д., передавая эти данные врачам в виде обновлений в режиме реального времени, которые затем могут разработать соответствующие методы лечения [1]. Data Science используется при анализе электронных медицинских карт и клинических исследований. Фармацевтическая промышленность постоянно использует важную статистическую информацию, полученную из самых разных источников.

Data Science — это междисциплинарная область, которая извлекает знания и идеи из большого количества структурированных и неструктурированных данных с использованием научных методов, методов интеллектуального анализа данных, алгоритмов машинного обучения и больших данных [2]. Отрасль здравоохранения генерирует большие наборы данных полезной информации о демографии пациентов, планах лечения, результатах медицинских осмотров, страховках и т. д. Данные, собираемые с устройств Интернета вещей (IoT), привлекают внимание специалистов по данным. Наука о данных помогает обрабатывать, управлять, анализировать и усваивать большие объемы фрагментированных, структурированных и неструктурированных данных, созданных системами здравоохранения [3]. Эти данные требуют эффективного управления и анализа для получения фактических результатов.

Отрасль здравоохранения совершает революцию, применяя передовые технологии машинного обучения и анализа данных. Будь то уход за пациентами, операции и фармацевтика, применение науки о данных имеет далекие перспективы. К вариантам использования Data Science в здравоохранении можно отнести следующие компоненты:

  • обнаружение наркотиков;

Основной вклад науки о данных в фармацевтическую промышленность заключается в создании основы для синтеза лекарств с использованием искусственного интеллекта. Профилирование мутаций и метаданные пациентов используются для разработки соединений, учитывающих статистическую корреляцию между атрибутами.

  • виртуальная помощь;

В настоящее время чат-боты и платформы искусственного интеллекта разрабатываются учеными, занимающимися данными, чтобы помочь людям лучше понять свое здоровье, вводя определенную информацию о себе и получая точный диагноз. Кроме того, эти платформы также помогают потребителям с полисами медицинского страхования и лучшими руководствами по образу жизни.

  • носимые устройства;

Современное явление Интернета вещей (IoT), которое обеспечивает максимальную связь, является значимым преимуществом для науки о данных. Теперь, когда эта технология применяется в области медицины, она может помочь в мониторинге здоровья пациентов [4; 5]. В настоящее время мониторы физической подготовки и умные часы используются людьми для отслеживания и управления своим здоровьем. Кроме того, эти носимые сенсорные устройства могут отслеживаться врачом, если им предоставлен доступ, а в хронических случаях врач может удаленно предлагать решения пациенту.

  • отслеживание здоровья пациента;

Для общественного здравоохранения Data scientists разработали носимые устройства, которые позволяют врачам собирать большую часть этих данных, таких как частота сердечных сокращений, характер сна, уровень глюкозы в крови, уровень стресса и даже активность мозга. С помощью инструментов обработки данных и алгоритмов машинного обучения врачи могут выявлять и отслеживать распространенные состояния, такие как сердечные или респираторные заболевания.

Технология Data Science также может обнаруживать малейшие изменения в показателях здоровья пациента и прогнозировать возможные нарушения. Различные носимые и домашние устройства как часть сети IoT используют аналитику в реальном времени, чтобы предсказать, столкнется ли пациент с какой-либо проблемой, исходя из его текущего состояния.

  • диагностика;

Так как диагностика является неотъемлемой частью медицинских услуг, ее можно упростить и ускорить с помощью приложений обработки данных в здравоохранении. Анализ данных пациента не только способствует раннему выявлению проблем со здоровьем, но также может быть подготовлен медицинскими тепловыми картами, относящимися к демографическим характеристикам заболеваний [6].

  • предиктивная аналитика в здравоохранении;

Прогностическая аналитическая модель использует исторические данные, находит закономерности на основе данных и генерирует точные прогнозы. Данные могут включать в себя что угодно, от артериального давления и температуры тела пациента до уровня сахара. Прогнозирующие модели в науке о данных сопоставляют и связывают каждую точку данных с симптомами, привычками и заболеваниями. Это позволяет определить стадию заболевания, степень поражения и необходимую лечебную меру.

Предиктивная аналитика в здравоохранении также помогает отслеживать хроническими заболеваниями, предугадывать кризисные состояния пациента, а также быстро документировать данные больницы.

  • анализ медицинских изображений;

Медицинские работники часто используют различные методы визуализации, такие как рентген, МРТ и компьютерная томография, чтобы визуализировать внутренние системы и органы вашего тела.

Технологии машинного обучения и распознавания изображений в Data Science в области здравоохранения позволяют обнаруживать мельчайшие деформации на этих отсканированных изображениях, помогая врачам планировать эффективную стратегию лечения. Некоторые из часто используемых алгоритмов машинного обучения включают в себя:

  • алгоритм обработки изображения: для анализа изображения, улучшения и шумоподавления;
  • алгоритм обнаружения аномалий: для обнаружения переломов костей и смещения;
  • алгоритм описательного распознавания изображений: извлечение и интерпретация данных из изображений и объединение нескольких изображений для формирования более крупной картины.

Кроме того, специалисты по данным в области здравоохранения постоянно работают над разработкой более совершенных методов для улучшения анализа изображений. Например, в недавней публикации в журнале Towards Data Science было выявлено, что платформа машинного обучения Azure может использоваться для обучения и оптимизации модели для обнаружения наличия трех распространенных опухолей головного мозга: глиомы, менингиомы и опухоли гипофиза [7].

Одной из знакомых областей в здравоохранении является фармацевтическая промышленность, являющаяся одной из самых инновационных и конкурентоспособных отраслей в мире. Имея широкий ассортимент продукции, она должна быть конкурентоспособной на нескольких фронтах, от исследований и разработок до маркетинга и продаж. Data Science используется для повышения эффективности разработки лекарств, продаж и маркетинга. Это может помочь фармацевтическим компаниям не только лучше понять своих клиентов и предсказать новые тенденции на рынке, но и улучшить результаты лечения пациентов, изучая данные клинических испытаний и других клинических исследований, чтобы определить области для улучшения или новые методы лечения [5]. Кроме того, специалисты по данным используют алгоритмы машинного обучения, которые анализируют большие объемы данных на высоких скоростях, чтобы делать прогнозы будущих событий на основе исторических закономерностей, наблюдаемых в прошлых событиях (в Data Science в области фармацевтики — это известно, как прогнозное моделирование). Также в фармацевтической промышленности широко используются анализ сегментации, алгоритмы машинного обучения, инструменты визуализации и другие, помогающие улучшить процессы принятия решений.

Среди вариантов использования науки о данных в фармацевтической промышленности можно отметить:

  • использование прогностических моделей для разработки лекарств;

Прогностические модели чрезвычайно полезны при разработке лекарств, поскольку они помогают прогнозировать будущие результаты на основе прошлых наблюдений [8]. Например, если пациент принимает определенное лекарство в течение длительного времени и еще не вызвал никаких побочных эффектов, то для этого пациента может быть безопасно продолжать использовать это лекарство. С другой стороны, если есть какая-то новая информация о здоровье этого пациента, которая предполагает, что продолжение его текущего лечения может быть опасным (например, болезнь сердца), то прогностические модели могут определить, какой вариант принесет им больше пользы в целом при продолжении их текущего лечения или переход на другой тип лекарства. Эти модели в Data Science в фармацевтике помогают компаниям лучше понимать своих пациентов и принимать более обоснованные решения о том, какой уход им необходим, чтобы быстрее выздороветь. Это делается учеными-фармацевтами с помощью передовых методов, таких как алгоритмы машинного обучения и модели глубоких нейронных сетей.

  • прогнозирование потока/спроса пациентов;

Еще один пример использования науки о данных в фармацевтической промышленности — прогнозирование потока пациентов и спроса на конкретное лекарство или лекарство. Это помогает фармацевтическим компаниям определять производительность, удовлетворять существующие и будущие потребности при минимальных потерях, а также следить за производственным конвейером. Существующие данные и опросы могут помочь в создании моделей, которые могут прогнозировать количество пациентов, которым потребуется лекарство в ближайшие дни, недели или месяцы.

  • разработка систем поддержки принятия решений на основе данных;

Системы поддержки принятия решений на основе данных (DDDS) являются важной частью фармацевтической промышленности, особенно в области клинических исследований и разработок. DDDS помогает улучшить процесс принятия решений за счет анализа данных и предоставления в режиме реального времени информации об эффективности лекарственного препарата для различных групп пациентов [9].

  • содействие цифровым продажам и маркетингу;

Data Science стала важной частью цифрового маркетинга фармацевтической промышленности и используется, чтобы помочь компаниям понять своих клиентов, кто они и что им нужно. Данные помогают им разрабатывать новые продукты или процессы, которые эффективно охватывают этих людей.

  • анализ медицинских изображений;

Еще одним передовым и революционным вариантом использования Data Science в фармацевтической промышленности является анализ медицинских изображений. Доказано, что анализ медицинских изображений позволяет выявить мельчайшие микроскопические дефекты. С помощью методов глубокого обучения в науке о данных программное обеспечение может быть создано для понимания и интерпретации изображений, таких как рентгеновские снимки, МРТ, маммограммы и т. д. Эти передовые методы также можно использовать для изучения роста определенного микроорганизма, такого как бактерии, в организме человека, что может дополнительно помочь фармацевтическим компаниям разработать эффективное лекарство, способное противодействовать наблюдаемой модели роста этого микроорганизма.

  • индивидуальная диагностика и лечение;

Концепция персонализированной диагностики и лечения означает, что врачи уже могут видеть, какой препарат будет лучше всего работать для каждого пациента, исходя из его индивидуальных симптомов и генетической структуры [10]. Этот тип индивидуального ухода помогает пациентам быстрее выздоравливать, экономя деньги на ненужных тестах и ​​процедурах, которые не нужны сразу (или когда-либо). Это также означает меньшее количество побочных эффектов и, следовательно, меньшие общие затраты на здоровье.

  • расчет ожидаемого жизненного цикла патентов на лекарства;

Жизненный цикл патента – это время между датой подачи заявки на патент и датой истечения срока действия патента [11]. Это можно использовать, чтобы определить, сколько денег компания может заработать на лекарстве и будет ли она прибыльной с помощью науки о данных в фармацевтике. Чтобы рассчитать это, нужно знать, сколько времени потребуется другой фармацевтической компании, чтобы придумать собственную идею. Это можно определить с помощью Data Science и машинного обучения, используя прошлые данные.

  • доступ к информации в режиме реального времени через приложения для отслеживания здоровья;

Если фармацевтическая компания хочет использовать Data Science в своем бизнесе, должен быть доступ к информации о здоровье пациентов в режиме реального времени. Это возможно с помощью приложений для отслеживания здоровья, которые собирают данные о здоровье пользователей. Эти приложения для здоровья доступны практически для всех смартфонов и планшетов, поэтому нет необходимости покупать специальное оборудование или программное обеспечение, прежде чем начать работу с этим типом решения для анализа данных. Например, приложение отслеживает ежедневные действия пользователей, такие как пройденные шаги в день (или только минуты) и калории, сожженные за счет сжигания энергии во время тренировок дома или на рабочем месте и т. д. Затем он может помочь отслеживать, какой режим упражнений лучше всего подходит для каждого отдельного пользователя в зависимости от его конкретных потребностей.

  • уменьшение побочных эффектов лекарств и нежелательных реакций;

Побочные эффекты лекарств и нежелательные реакции являются основными причинами неудовлетворенности пациентов. Data Science может помочь уменьшить вероятность того, что пациенты столкнутся с данными проблемами, используя прогностические модели для выявления пациентов с высоким риском до назначения лекарств.

  • повышение эффективности клинических испытаний.

Data Science помогает повысить эффективность клинических испытаний за счет автоматизации процессов, повышения точности и снижения затрат.

Благодаря тому, что фармацевтическая промышленность имеет в своем распоряжении огромное количество исторических данных с миллионами записей, в данной области Data Science может использоваться для различных целей, таких как разработка лекарств, проведение клинических испытаний, обслуживание клиентов, продажи и маркетинг. Разработчики разумно оперируют этими данными в соответствии со стандартами и законами в области здравоохранения.

Надлежащее сотрудничество между Big Pharma и Big Data помогло отрасли сократить расходы на исследования и разработки, улучшить клинические испытания, ускорить открытие новых лекарств, контролировать реакции на лекарства и сосредоточиться на продажах и маркетинге [12]. Большую часть Data Science в фармацевтике занимают модели прогнозной аналитики. Они могут использоваться для прогнозирования вероятности возникновения события, также они известны как «модели прогнозирования» или «механизмы прогнозирования» в контексте науки о данных [13]. Прогнозные модели позволяют делать прогнозы будущих событий с высокой степенью точности и достоверности, то есть они могут предоставлять информацию о том, что произойдет дальше, на основе прошлых наблюдений или тенденций в данном наборе данных. Они управляют большей частью процесса принятия решений в фармацевтической отрасли. Прогностические модели изучают закономерности на основе ранее существовавших клинических данных и могут отвечать на некоторые вопросы на основе ответов и входных переменных.

В ХХI веке Data Science активно используется в сфере здравоохранения для оптимизации операций и процедур восстановления пациентов. Помимо технического прогресса и растущей цифровизации образа жизни, наука о данных поможет сократить расходы на здравоохранение, сделав качественные медицинские услуги доступными для всех.

В фармацевтической отрасли Data Science анализирует текущие отношения между врачом и пациентов, предлагая докторам рекомендации по дальнейшему наблюдению клиентов. Также анализ поведения пациента, такого как частота посещений, лабораторные тесты в сочетании с личной информацией и историей болезни, может использоваться для понимания потребностей посетителей [14].

В фармацевтической промышленности Data Science помогает создавать новые лекарства, выявлять побочные эффекты, улучшать клинические испытания и доказывать эффективность существующих лекарств. Данные можно использовать для разработки более эффективных методов лечения пациентов с конкретными заболеваниями или состояниями путем анализа больших наборов данных об их симптомах и возможных причинах. Это поможет врачам в диагностике и вариантах лечения, которые могут быть более эффективными, чем то, что они знали раньше. Еще одна важная возможность в фармацевтической науке о данных включает анализ изображений с использованием глубокого обучения [15]. Это помогает выявлять такие заболевания, как рак, на гораздо более ранней стадии, которые в противном случае могли бы остаться незамеченными человеческим глазом. Данные также могут ускорить открытие лекарства в случае вновь обнаруженного заболевания. Повторные испытания и сбор данных могут помочь фармацевтической промышленности быстро разработать новое лекарство с использованием передовых моделей науки о данных.

Вышеупомянутые примеры использования Data Science в здравоохранении показывают, что в ближайшем будущем Big Data станут ключевым игроком в медицинской отрасли, и то, как данные хранятся и используются сейчас, повлияет на то, каким будет здоровье людей в долгосрочной перспективе. Конечно, огромный потенциал Big Data сопряжен с некоторыми рисками, такими как отсутствие стандартизированных данных и неэффективная политика управления данными. Тем не менее, такие проблемы можно преодолеть, установив некоторые протоколы для обработки данных в здравоохранении, такие как обеспечение конфиденциальности, поддержание безопасности и работа над расширением инструментов, используемых для анализа данных, чтобы сделать их как можно более безошибочными.

References

1. Стеценко А.П. ИННОВАЦИИ: DATA SCIENCE // Успехи в химии и химической технологии. 2021. №1 (236). URL: https://cyberleninka.ru/article/n/innovatsii-data-science (дата обращения: 05.06.2023).
2. Грицков И.О., Говоров А.В., Васильев А.О., Ходырева Л.А., Ширяев А.А., Пушкарь Д.Ю. DATA SCIENCE - ГЛУБОКОЕ ОБУЧЕНИЕ НЕЙРОСЕТЕЙ И ИХ ПРИМЕНЕНИЕ В ЗДРАВООХРАНЕНИИ // Здоровье мегаполиса. 2021. №2. URL: https://cyberleninka.ru/article/n/data-science-glubokoe-obuchenie-neyrosetey-i-ih-primenenie-v-zdravoohranenii (дата обращения: 05.06.2023).
3. Bogomolov A.I., Nevejin V.P. От больших данных к большим знаниям // Хроноэкономика. 2017. №2 (4). URL: https://cyberleninka.ru/article/n/ot-bolshih-dannyh-k-bolshim-znaniyam (дата обращения: 05.06.2023).
4. Лочкарева Т.Г. Интернет вещей // Инновационная наука. 2016. №12-2. URL: https://cyberleninka.ru/article/n/internet-veschey-1 (дата обращения: 05.06.2023).
5. Горькавый А.В., Ляшенко С.А. Интернет вещей // Научный журнал. 2018. №5 (28). URL: https://cyberleninka.ru/article/n/internet-veschey-3 (дата обращения: 05.06.2023).
6. Комарь П.А., Дмитриев В.С., Ледяева А.М., Шадеркин И.А., Зеленский М.М. РЕЙТИНГ СТАРТАПОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА: ПЕРСПЕКТИВЫ ДЛЯ ЗДРАВООХРАНЕНИЯ РОССИИ // Журнал телемедицины и электронного здравоохранения. 2021. №3. URL: https://cyberleninka.ru/article/n/reyting-startapov-iskusstvennogo-intellekta-perspektivy-dlya-zdravoohraneniya-rossii (дата обращения: 05.06.2023).
7. Anaya-Isaza A, Mera-Jiménez L, Verdugo-Alejo L, Sarasti L. Optimizing MRI-based brain tumor classification and detection using AI: A comparative analysis of neural networks, transfer learning, data augmentation, and the cross-transformer network. Eur J Radiol Open. 2023 Mar 14;10:100484. doi: 10.1016/j.ejro.2023.100484. PMID: 36950474; PMCID: PMC10027502. URL: https://pubmed.ncbi.nlm.nih.gov/36950474/ (дата обращения: 05.06.2023).
8. Маркин В. А. Разработка методологии прогностически значимой оценки защитной эффективности противовирусных препаратов // Вопросы вирусологии. 2012. №2. URL: https://cyberleninka.ru/article/n/razrabotka-metodologii-prognosticheski-znachimoy-otsenki-zaschitnoy-effektivnosti-protivovirusnyh-preparatov (дата обращения: 07.06.2023).
9. Балашова И.В., Терещенко Т.А. СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ // The Scientific Heritage. 2021. №79-4. URL: https://cyberleninka.ru/article/n/sistemy-podderzhki-prinyatiya-resheniy (дата обращения: 07.06.2023).
10. Дедов И.И. ПЕРСОНАЛИЗИРОВАННАЯ МЕДИЦИНА // Вестник РАМН. 2019. №1. URL: https://cyberleninka.ru/article/n/personalizirovannaya-meditsina-2 (дата обращения: 07.06.2023).
11. Широкова Ирина Патенты на лекарства - Российская статистика // Ремедиум. 2008. №6. URL: https://cyberleninka.ru/article/n/patenty-na-lekarstva-rossiyskaya-statistika (дата обращения: 07.06.2023).
12. Volgina Natalia A. BUSINESS MODELS OF BIG PHARMA IN RUSSIA: A PHARMACEUTICAL VALUE CHAIN PERSPECTIVE // Вестник РУДН. Серия: Экономика. 2022. №1. URL: https://cyberleninka.ru/article/n/business-models-of-big-pharma-in-russia-a-pharmaceutical-value-chain-perspective (дата обращения: 07.06.2023).
13. Гусев А.В., Новицкий Р.Э. ТЕХНОЛОГИИ ПРОГНОЗНОЙ АНАЛИТИКИ В БОРЬБЕ С ПАНДЕМИЕЙ COVID-19 // Врач и информационные технологии. 2020. №4. URL: https://cyberleninka.ru/article/n/tehnologii-prognoznoy-analitiki-v-borbe-s-pandemiey-covid-19 (дата обращения: 07.06.2023).
14. Колесниченко О.Ю., Мартынов А.В., Пулит В.В., Колесниченко Ю.Ю., Шакиров В.В., Варламов О.О., Минушкина Л.О., Сотник А.Ю., Жилина Т.Н., Дорофеев В.П., Смородин Г.Н., Жапаров М.К., Мазелис Л.С. Современный передовой уровень искусственного интеллекта для умной медицины // Ремедиум. 2019. №4. URL: https://cyberleninka.ru/article/n/sovremennyy-peredovoy-uroven-iskusstvennogo-intellekta-dlya-umnoy-meditsiny (дата обращения: 07.06.2023).
15. Гусев А.В. Перспективы нейронных сетей и глубокого машинного обучения в создании решений для здравоохранения // Врач и информационные технологии. 2017. №3. URL: https://cyberleninka.ru/article/n/perspektivy-neyronnyh-setey-i-glubokogo-mashinnogo-obucheniya-v-sozdanii-resheniy-dlya-zdravoohraneniya (дата обращения: 07.06.2023).
16. Drygin, D. S. Application of artificial intelligence in medicine / D. S. Drygin, N. N. Pronkin // International Journal of Professional Science. – 2020. – No. 1. – P. 35-38. – EDN FXALDK.
17. Глущенко, В. М. Новые информационные технологии / В. М. Глущенко, М. Н. Малышев, Н. Н. Пронькин. – Москва : Московский городской университет управления Правительства Москвы, 2012. – 44 с. – EDN BOSPLV.
18. Искусственный интеллект / О. И. Веселицкий, В. М. Глущенко, В. С. Елизаров, Н. Н. Пронькин. – Москва : Московский городской университет управления Правительства Москвы, 2012. – 30 с. – EDN ABUHSV.