Abstract: The paper presents a new approach to energy demand forecasting based on analysing data from social networks, news sources, search queries and environmental sensors. A hybrid model combining traditional forecasting methods with methods of unstructured data processing is developed. The advantages of this approach for improving the accuracy of forecasts and optimising power system operation are shown.
Keywords: Energy demand forecasting, unstructured data, social networks, machine learning, hybrid models, energy system.
Эффективное прогнозирование спроса на энергию играет ключевую роль в оптимизации работы энергосистем, снижении издержек, обеспечении надежности и стабильности электроснабжения. Традиционные модели, основанные исключительно на исторических данных о потреблении и метеорологических параметрах, часто не способны обеспечить достаточную точность прогнозов, так как они не учитывают многие факторы, влияющие на спрос в реальном времени. В статье рассматривается новый подход к прогнозированию спроса на энергию, основанный на анализе данных из социальных сетей, новостных источников, поисковых запросов и датчиков окружающей среды [1]. Данный подход позволяет создать более точную, адаптивную и проактивную модель прогнозирования, способную предсказывать изменения в спросе задолго до их возникновения, что способствует эффективной интеграции ВИЭ и повышению надежности работы энергосистемы.
Предлагаемая модель прогнозирования основана на концепции гибридного подхода, который сочетает анализ структурированных и неструктурированных данных. Структурированные данные включают в себя исторические данные о потреблении электроэнергии (почасовое, посуточное, сезонное потребление), метеорологические данные (температура, влажность, скорость ветра), данные о графиках работы промышленных предприятий и другие статистические данные. Неструктурированные данные включают в себя сообщения в социальных сетях (ВКонтакте, Одноклассники), новостные статьи, блоги, форумы, поисковые запросы (OpenAI, Яндекс), а также данные с датчиков температуры, освещенности, влажности и других параметров, поступающих от систем “умного дома” и “умного города” [2].
Для обработки неструктурированных данных используется ряд методов, включая обработку естественного языка (NLP), анализ тональности, геопространственный анализ и методы машинного обучения. NLP позволяет извлекать ключевые слова, события, имена, места, время и другие значимые элементы из текстовых данных. Анализ тональности позволяет определить эмоциональную окраску сообщений в социальных сетях и на форумах, что может указывать на изменение потребительских настроений и, как следствие, на изменение спроса. Геопространственный анализ позволяет выявить локальные тренды и события, которые могут влиять на спрос в конкретном регионе. Например, если в каком-то районе пройдет фестиваль, то это вызовет локальное увеличение потребления энергии [3]. Методы машинного обучения (классификация, кластеризация) помогают систематизировать и классифицировать полученные данные.
Предлагаемая гибридная модель прогнозирования состоит из трех основных модулей: модуль обработки структурированных данных, модуль обработки неструктурированных данных и модуль интеграции. Модуль обработки структурированных данных использует традиционные модели прогнозирования (ARIMA, ETS, линейная регрессия, нейронные сети) для прогнозирования на основе исторических данных. Модуль обработки неструктурированных данных использует алгоритмы NLP, анализа тональности и геопространственного анализа для извлечения значимой информации из неструктурированных источников. Модуль интеграции объединяет результаты работы первых двух модулей, используя нейросети (LSTM, Transformer, GRU), которые обучаются на исторических данных и данных, полученных из неструктурированных источников. Важно отметить, что модуль интеграции использует методы оценки неопределенности (например, байесовские сети) для более точной оценки доверительных интервалов прогноза.
Рассмотрим ситуацию, когда в городе ожидаются резкие перепады температуры. Модель прогнозирования получает данные от метеорологических служб, которые указывают на приближение холодного фронта. В то же время модель анализирует сообщения в социальных сетях и выявляет рост сообщений об отоплении и снижении количества сообщений о кондиционерах. Модель также анализирует поисковые запросы и видит рост поисковых запросов о “как обогреть дом”. На основе этой информации модель прогнозирует увеличение спроса на электроэнергию, связанное с использованием обогревателей. Модель интегрирует всю эту информацию и корректирует прогноз, позволяя энергетическим компаниям вовремя подготовиться к возрастающему спросу [4]. Преимущества предлагаемой модели наглядно отражены в таблице 1.
Таблица 1
Сравнительный анализ результатов прогнозирования с использованием традиционных методов и предлагаемой гибридной модели
Критерий оценки | Традиционные методы | Гибридная модель | Комментарий |
Точность прогноза (RMSE) | Зависит от точности исторических данных и метеопрогнозов, может быть высокой в стабильных условиях, но падает при аномалиях. | Сниженный RMSE за счет учета поведенческих факторов, настроений, внезапных событий и локальных трендов. Адаптируется к изменениям спроса более эффективно. | Гибридная модель использует более широкий спектр данных, что повышает ее устойчивость к неожиданным изменениям и аномалиям. |
Точность прогноза (MAE) | Может показывать более высокую ошибку в периоды резких изменений спроса. Ограничена возможностями учета влияния нетрадиционных факторов. | Сниженный MAE, так как модель лучше адаптируется к колебаниям спроса, благодаря анализу тональности в соц. сетях, поисковых запросов и данных от датчиков. | Анализ настроений и трендов в соц. сетях помогает смягчить влияние аномальных выбросов на точность прогноза. |
Точность прогноза (MAPE) | Может иметь высокую погрешность при прогнозировании пиковых нагрузок и внезапных изменений спроса, особенно когда эти изменения не предсказываются традиционными факторами | Сниженный MAPE, особенно в периоды пиковых нагрузок, так как модель реагирует на информацию о событиях, которые могут вызвать рост спроса (например, анализ поисковых запросов о “как обогреть дом”). | Гибридная модель более точно прогнозирует внезапные изменения спроса, что особенно важно для планирования энергопотребления в экстремальных ситуациях, таких как резкие перепады температуры. |
Учет краткосрочных колебаний спроса | Ограничен запаздыванием данных, не учитывает реакцию потребителей на события в режиме реального времени. | Высокий, реагирует на изменения в потребительском поведении и настроении в режиме реального времени, основываясь на данных из социальных сетей, поисковых запросов и датчиков. | Модель способна оперативно реагировать на внезапные события и учитывать изменения настроения потребителей, что отражается на более точном прогнозе краткосрочных колебаний. |
Учет долгосрочных трендов спроса | Опирается на исторические данные, может отставать от изменений в потребительском поведении. | Учитывает изменения в потребительском поведении (анализ упоминаний технологий, связанных с энергосбережением), и настроения (анализ тональности). | Анализ социальных трендов позволяет модели учитывать долгосрочные изменения в потреблении энергии, связанные с развитием технологий и изменениями в потребительских предпочтениях. |
Учет внешних событий | Учитывает в основном запланированные события (например, праздники), не реагирует на внезапные события и изменения настроения | Учитывает не только запланированные, но и внезапные события, а также эмоциональные реакции (например, отключения, спортивные мероприятия, изменения погоды, аномалии). | Модель позволяет учесть влияние широкого спектра событий, в том числе тех, которые обычно не учитываются в традиционных моделях, что повышает точность прогноза в условиях нестабильной внешней среды. |
Объяснимость модели | Высокая, легко интерпретировать результаты на основе исторических данных и метеопрогнозов. | Средняя, сложнее интерпретировать влияние отдельных факторов из-за интеграции структурированных и неструктурированных данных. Требуется дополнительный анализ для понимания влияния данных из соц. сетей. | Требуется более глубокий анализ для понимания влияния каждого из источников неструктурированных данных на конечный прогноз, но дает возможность более полного анализа. |
Затраты на разработку и внедрение | Низкие до средних, зависит от сложности традиционной модели. | Высокие, так как требуются ресурсы для сбора, обработки и анализа больших объемов данных из социальных сетей, новостных источников и датчиков. | Внедрение гибридной модели требует существенных инвестиций в инфраструктуру и разработку алгоритмов, но дает возможность повысить точность и адаптивность системы прогнозирования. |
Необходимые данные | Исторические данные потребления, метеорологические данные, статистические данные. | Исторические данные потребления, метеорологические данные, данные из социальных сетей, поисковых запросов, новостные источники, данные датчиков. | Требуется сбор и обработка большого объема разнородных данных из различных источников, включая как структурированные, так и неструктурированные [5]. |
Использование неструктурированных данных и интеграция их с традиционными моделями прогнозирования позволяют повысить точность, адаптивность и проактивность модели, улучшить планирование производства и распределения энергии, снизить издержки и повысить надежность работы энергосистемы. Кроме того, такой подход позволяет более эффективно интегрировать возобновляемые источники энергии, обеспечивая их стабильную работу и снижая зависимость от традиционных источников.
References
1. Бабанова И.С. Разработка перспективного планирования энергосистемы с применением искусственных нейронных сетей // Материалы молодежной конференции по надежности, безопасности и эффективности энергетических систем, поиск инновационных решений: Сборник тезисов докладов 3-го Междунар. энергетич. форума. - СПб., 2015. - С. 49.2. Нафиков, И. Р. Информационный обзор смарт–городов и автоматизации инфраструктуры, обозначающей путь к устойчивому будущему / И. Р. Нафиков, О. В. Борисова // X Международная научно-практическая заочная конференция "ЭТАП-2023", посвященная 219-летию КФУ, Набережные Челны, 23 ноября 2023 года. – Набережные Челны: Казанский (Приволжский) федеральный университет, 2024. – С. 541-544. – EDN WHALMO.
3. Бабанова, И. С. Разработка перспективного планирования энергосистемы на основе сравнительного анализа различных методов прогнозирования энергопотребления / И. С. Бабанова // Электроэнергетика глазами молодежи - 2016 : Материалы VII Международной молодёжной научно-технической конференции. В 3 т., Казань, 19–23 сентября 2016 года. Том 2. – Казань: Казанский государственный энергетический университет, 2016. – С. 43-46.
4. Analyzing the relationship between Twitter data and electricity consumption using a multi-layer perceptron (MLP) model / S.S.M. Abdulrahman, J.P. Singh, B.P. Loo, M.M. Mansor // Energy Reports. – 2022. – Vol. 8. – P. 1482-1490. – URL: https://www.sciencedirect.com/science/article/pii/S235248472100831X (дата обращения: 09.01.2025). – Текст: электронный.
5. Мыльников, В. И. Проблемы использования технологии LoRaWAN в системах диспетчеризации / В. И. Мыльников, О. В. Борисова // Тенденции развития науки и образования. – 2024. – № 105-14. – С. 144-146. – DOI 10.18411/trnio-01-2024-727. – EDN KRJWBX.