Abstract: The paper addresses the problem of early filtering of unprofitable traffic sources in programmatic advertising (RTB) systems. The research focuses on predicting the success of banner campaigns under conditions of limited historical data. A probabilistic model is proposed that formalizes source success through a set of business metrics (costs, profit, ROI) as a binary hypothesis. The method is based on calculating Bayesian probabilities for source parameters (country, ad-system, app, tag) and their interactions using smoothing, a hierarchical backoff approach, and logarithmic weighting. The model is implemented on a PHP/MySQL/ClickHouse stack and tested on real data from Inspiritum LLC. Experiments on a hold-out dataset showed an Accuracy of about 90% with an F1-score of approximately 0.5. A positive economic effect was confirmed due to reduced costs for ineffective sources. The developed approach is applicable as an interpretable decision support tool for advertising budget management.
Keywords: Bayesian method, statistics, real-time bidding, programmatic advertising, adaptive forecasting models, performance metrics
Введение
В программатик-рекламе используется модель мгновенных аукционов (RTB), где каждый показ продается в реальном времени за 150–200 мс [9, 15]. Это позволяет гибко настраивать таргетинг [8, 13], но требует от менеджера анализа огромного количества параметров по каждому источнику. С ростом числа кампаний ручная обработка данных становится невозможной: на одного сотрудника могут приходиться сотни кампаний с десятками тысяч источников. Для оперативного принятия решений о перераспределении бюджета и сокращении издержек необходима автоматизированная система поддержки принятия решений (СППР) [2, 4].
Существующие ML-решения (нейросети, бустинг) эффективны, но часто дороги во внедрении и работают как «чёрный ящик», что затрудняет интерпретацию результатов [6, 12]. В данной работе предлагается подход на основе байесовской вероятностной модели, который сочетает вычислительную эффективность с прозрачностью критериев принятия решений [1, 3].
Цель работы — разработка метода прогнозирования успешности баннерных кампаний на основе байесовского подхода.
Задачи:
– рассчитать априорные и условные вероятности успеха для параметров источников на основе статистики;
– формализовать модель по теореме Байеса с учётом взаимодействий параметров;
– реализовать расчетный модуль (PHP, MySQL, ClickHouse);
– протестировать модель на валидационной выборке и оценить экономический эффект.
Метод исследования
Для прогнозирования эффективности рекламы часто применяются логистическая регрессия, градиентный бустинг и нейросети [6,7,12,13]. Однако в условиях высокой динамики RTB-аукционов и требований к интерпретируемости оптимальным выбором становится байесовский подход [1, 11]. Он позволяет работать с разреженными данными и обновлять прогноз в режиме online [11, 14].
В рамках исследования «успешность» источника формализуется как бинарное событие, зависящее от достижения целевых показателей по расходам (spent), прибыли (profit) и ROI.
References
1. Ветров Д. П., Кропотов Д. А. Байесовские методы машинного обучения: курс лекций. — М.: ВМиК МГУ, 2007. — 240 с.2. Елкин Д. А., Минаков И. А., Вольман С. И. Автоматическая оптимизация интернет-рекламы // Вестник Самарского государственного технического университета. Серия: Технические науки. — 2011. — С. 228–232. — [Электронный ресурс] — URL: https://cyberleninka.ru/article/n/avtomaticheskaya-optimizatsiya-internet-reklamy (дата обращения: 16.03.2026).
3. Звягин Л. С. Применение байесовского подхода в измерениях аналитических данных как фактор формирования процессов системного экономического развития // Молодой учёный. — 2017. — № 22 (156). — С. 256–261.
4. Индустриев M.A., Игнатьев M.A. Автоматизация управленческих решений как новый фактор повышения эффективности менеджмента организации // Гуманитарный научный журнал. 2020. №1. c.68-76 DOI: https://doi.org/10.24411/2078-9661-2020-10010
Статья опубликована на условиях лицензии Creative Commons Attribution License (CC-BY 4.0). — [Электронный ресурс] — URL: https://cyberleninka.ru/article/n/avtomatizatsiya-upravlencheskih-resheniy-kak-novyy-faktor-povysheniya-effektivnosti-menedzhmenta-organizatsii (дата обращения: 16.03.2026).
5. Михайленко Н.Н. Оценка эффективности рекламной кампании в условиях информационного-технологического прогресса // Научный результат. Технологии бизнеса и сервиса. 2023. Т. 9 № 4. С. 153-162. DOI: 10.18413/2408-9346-2023-9-4-1-3 — [Электронный ресурс] — URL: https://cyberleninka.ru/article/n/otsenka-effektivnosti-reklamnoy-kampanii-v-usloviyah-informatsionnogo-tehnologicheskogo-progressa (дата обращения: 16.03.2026).
6. Чуб, В. С. Сравнительный анализ методов машинного обучения в оценке кредитных рисков / В. С. Чуб // Образовательные ресурсы и технологии. — 2023. С. 81-92. DOI 10.21777/2500-2112-2023-3-81-92 — [Электронный ресурс] — URL: https://cyberleninka.ru/article/n/sravnitelnyy-analiz-metodov-mashinnogo-obucheniya-v-otsenke-kreditnyh-riskov (дата обращения: 16.03.2026).
7. Пилипенко, А. Ю. Прогнозирование спроса на товары средствами машинного обучения / А. Ю. Пилипенко // StudNet: научно-образовательный журнал для студентов и преподавателей. — 2022. № 2. С. 1278-1291 — [Электронный ресурс] — URL: https://cyberleninka.ru/article/n/prognozirovanie-sprosa-na-tovary-sredstvami-mashinnogo-obucheniya (дата обращения: 16.03.2026).
8. Пономарев М.А., Пономарева А.М. Трансформация маркетинг-микс в digital-среде на основе развития функций интернет-маркетинга // Финансовые исследования. 2023. Т.24, Nº4. С. 75-83. DOI: 10.54220/finis.1991-0525.2023.81.4.007.
9. Семёнов А. А., Варламов О. О. Исследование способов подбора рекламных кампаний на основе сравнения многомерных векторов // Проблемы искусственного интеллекта. — 2020. — № 2 (17). — С. 94–109. — [Электронный ресурс] — URL: https://cyberleninka.ru/article/n/issledovanie-sposobov-podbora-reklamnyh-kampaniy-na-osnove-sravneniya-mnogomernyh-vektorov-1 (дата обращения: 16.03.2026).
10. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных / пер. с англ. А. А. Слинкина. — 2-е изд., эл. — М.: ДМК Пресс, 2023. — 401 с. — ISBN 978-5-89818-300-4.
11. Graepel T., Quiñonero Candela J., Borchert T., Herbrich R. Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft's Bing Search Engine // Proceedings of the 27th International Conference on Machine Learning (ICML-2010). — 2010. — P. 13–20.
12. He X., Pan J., Jin O. et al. Practical Lessons from Predicting Clicks on Ads at Facebook // Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. — 2014. — P. 1–9.
13. McMahan H. B. et al. Ad Click Prediction: a View from the Trenches // Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. — 2013. — P. 1222–1230.
14. Richardson M., Dominowska E., Ragno R. Predicting Clicks: Estimating the Click-Through Rate for New Ads // Proceedings of the 16th International World Wide Web Conference. — 2007. — P. 521–530.
15. Wang J., Zhang W., Yuan S. Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting // Foundations and Trends in Information Retrieval. — 2017. — Vol. 11, No. 4–5. — P. 297–435. — DOI: 10.1561/1500000049.
