Calibration of gas sensor data classification models

UDC 69
Publication date: 05.07.2023
International Journal of Professional Science №7-2023

Calibration of gas sensor data classification models

Калибровка моделей классификации данных газовых сенсоров

Vitiugova Iuliia

Lomonosov Moscow State University
Skobeltsyn Institute of Nuclear Physics
Laboratory of Adaptive Methods of Data Processing
Scientific supervisors: Sergey Dolenko, Alexander Efitorov



Витюгова Юлия

Московский государственный университет имени М.В.Ломоносова
Научно-исследовательского института ядерной физики имени Д.В. Скобельцына
Лаборатория адаптивных методов обработки данных
Научные руководители: С.А. Доленко, А.О. Ефиторов

Аннотация: В данной научной работе рассматривается проблема хранения и обработки сенсорных данных в современной микроэлектронике и их применение в системах мониторинга. В качестве иллюстрации проведено исследование с использованием газовых датчиков. Рассматривалась эффективность методов калибровки при различных алгоритмах машинного обучения при решении задачи классификации газов. В особенности, статья выделяет важность калибровки моделей в машинном обучении для повышения эффективности предсказаний и прояснения линейности функции принадлежности.

Abstract: This scientific work focuses on the problem of storing and processing sensor data in modern microelectronics and their application in monitoring systems. An experiment was conducted using gas sensors as an illustration. The efficiency of calibration methods was examined using various machine learning algorithms to solve the problem of gas classification. In particular, the paper emphasizes the importance of model calibration in machine learning to enhance the accuracy of predictions and explain the linearity of the membership function.
Ключевые слова: сенсорные данные, газовые датчики, машинное обучение, анализ больших данные, калибровка моделей.

Keywords: sensor data, gas sensors, machine learning, big data analysis, model calibration.


Введение

В настоящее время заметны весьма значительные успехи в развитии микроэлектроники и коммуникационных технологий, повсеместное проникновение цифровых технологий привели к появлению огромных объемов сенсорных данных. Сбор, хранение и анализ сенсорных данных, являются немаловажным направлением деятельности в современном мире (I. Shafer, 2013). Сенсорные данные от датчика представляют собой временные ряды. Примерами источников данных являются системы управления производством, системы эксплуатационного мониторинга телекоммуникационных систем, системы автоматизации научных исследований. Анализ сенсорных данных позволяет контролировать изменение состояния объекта мониторинга во времени, изучать закономерности поведения, выявлять тенденции, удаленно диагностировать неисправности, принимать обоснованные решения по управлению объектом. Задача хранения сенсорных данных, таким образом, является актуальной и уже имеет множество решений. Недавний систематический поиск программного обеспечения баз данных временных рядов обнаружил 83 программных системы, и не похоже, чтобы на этом развитие темы закончилось (A. Bader, 2017). Разнообразие решений вызвано разнообразием условий задачи, в числе которых количество датчиков, темп поступления данных, длительность хранения, преобладание запросов на запись или на чтение, типы запросов на чтение, экономические ограничения. В исследуемой работе были рассмотрены данные с газовых сенсоров, представляющие собой простые временные ряды. Суть эксперимента заключалась в устранении утечек в трубопроводе с помощью создания газовых сенсоров. Проверка трубопровода основана на оценках: с помощью численных моделей, на основе параметров работы трубопровода, обнаружения акустической эмиссии и т.д. В нашем случае модель предсказывала значение одного из двух классов в ходе которых выступали газы: пропан и водород. Проводился анализ функции ответа выходов модели на валидационной выборке, приводя ее к линейному виду для того, чтобы оценить степень принадлежности примера к тому или иному классу. По итогу рассматривалась эффективность методов калибровки при различных алгоритмах машинного обучения при решении задачи бинарной классификации.

Модели машинного обучения помогают принимать решения в весьма сложных и ответственных задач, решение которых без участия человека казалось ранее недоступным. Наряду с этим одной из важнейших и до конца нерешённых теоретических и практических проблем в машинном обучении является калибровка моделей. На протяжении обучения в связи с разными причинами итоговая модель может демонстрировать разную эффективность для всевозможных примеров. Вытекающий фактор — функция числа, показывающая принадлежность примера к тому или иному классу не является линейной. Вместе с тем при выборе по порогу предполагается линейное и одинаковое поведение всех выходов сети. Калибровкой модели называют задачу приведения функции принадлежности к линейному виду.

 

Читать далее…

References

1. I. Shafer, R.R. Sambasivan, A. Rowe, G.R. Ganger, Specialized storage for big numeric time series, 2013
2. A. Bader, O. Kopp, M. Falkenthal. “Survey and comparison of open-source time series databases, 2017.
3. Chuan Guo, Geoff Pleiss, Yu Sun, Kilian Q. Weinberger. On Calibration of Modern Neural Networks, 2017.
4. Max Kuhn. Applied Predictive Modeling, 2017.
5. Valeriy V. Krivetskiy, Matvei D. Andreev, Aleksandr O. Efitorov, Alexander M. Gaskov. Statistical shape analysis of temperature modulated metal oxide gas sensor response for improved selectivity of hydrocarbons detection in real atmospheric conditions, 2020.
6. Jochen Brö cker and Leonard A. Smith. Increasing the Reliability of Reliability Diagrams, 2007.
7. Alexandru Niculescu-Mizil, Rich Caruana. Predicting Good Probabilities with Supervised Learning, 2005.
8. Bianca Zadrozny Charles Elkan. Obtaining calibrated probability estimates from decision trees and naive Bayesian classifiers, 2001.
9. Tim Leathart, Maksymilian Polaczuk, Temporal Probability Calibration, 2020.
10. Taejong Joo, Uijung Chung, Min-Gwan Seo, Being Bayesian about Categorical Probability, 2020.
11. Tim Leathart Eibe Frank Bernhard Pfahringer Geoffrey Holmes, On Calibration of Nested Dichotomies, 2018.