Investigation of the effectiveness of machine learning methods with reinforcement in the traveling salesman problem

UDC 69
Publication date: 29.06.2023
International Journal of Professional Science №6-2023

Investigation of the effectiveness of machine learning methods with reinforcement in the traveling salesman problem

Исследование эффективности методов машинного обучения с подкреплением в задаче коммивояжера

Kutekhov Dmitry Olegovich
Areshin Stanislav Olegovich
Scientific director - Sudakov Vladimir Anatolievich
1. Graduate student.
federal state budget educational institution higher education "Moscow Aviation Institute (National Research University)"
2, Graduate student.
federal state budget educational institution higher education "Moscow Aviation Institute (National Research University)"
3. Leading Researcher. Doctor of Technical Sciences, IPM them. M.V. Keldysh RAS


Кутехов Дмитрий Олегович
Арешин Станислав Олегович
Научный руководитель - Судаков Владимир Анатольевич
1. Студент магистратуры.
Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский авиационный институт (национальный исследовательский университет)»
2, Студент магистратуры.
Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский авиационный институт (национальный исследовательский университет)»
3, Ведущий научный сотрудник. Доктор технических наук, ИПМ им. М.В. Келдыша РАН
Аннотация: В работе представлено решение задачи коммивояжера с применением различных алгоритмов обучения с подкреплением и проведен сравнительный анализ результатов, полученных при обучении алгоритмов путем минимизации длины конечного маршрута. Результат работы выбранного алгоритма сравнивался со случайным.

Abstract: The paper presents a solution to the traveling salesman problem using various reinforcement learning algorithms and a comparative analysis of the results obtained when learning algorithms by minimizing the length of the final route. The result of the selected algorithm was compared with a random one.
Ключевые слова: обучение с подкреплением, задача коммивояжера, комбинаторная задача оптимизации, глубокое обучение, эвристические алгоритмы, оптимизация маршрута

Keywords: reinforcement learning, traveling salesman problem, combinatorial optimization problem, deep learning, heuristic algorithms, route optimization


Введение.

Задача коммивояжера — древнейшая задача комбинаторной оптимизации, заключающаяся в поиске Гамильтонова графа — графа, содержащего гамильтонов цикл. При этом гамильтоновым циклом является такой цикл (замкнутый путь), который проходит через каждую вершину данного графа ровно по одному разу, то есть простой цикл, в который входят все вершины графа. Исследование решения задачи коммивояжера имеет богатую историю и обширный инструментарий различных подходов.

Другими словами, Задача коммивояжера (или TSP) заключается в нахождении кратчайшего возможного пути, соединяющего города с учетом матрицы расстояний между этими городами.

Задача имеет множество практических применений в различных областях, в том числе:

  1. Логистика и транспорт: решение задачи коммивояжера можно использовать для оптимизации маршрутов доставки для курьеров, водителей и грузовых компаний, сокращая расход топлива и время, необходимое для доставки.
  2. Производство и производство: оптимизация порядка производства в производственном процессе, сокращая время и затраты, необходимые для производства.
  3. Дизайн сети: оптимизация развертывания сетей связи, например, для размещения вышек сотовой связи.
  4. Секвенирование ДНК: определение порядка секвенирования фрагментов ДНК, что сокращает общее время и стоимость секвенирования.
  5. Робототехника и автоматизация: оптимизация пути робота, сокращения времени и энергии, необходимых для выполнения задачи.
  6. Туристическая индустрия: оптимизация маршрутов путешествий для туристов, снижения затрат и времени, необходимых для поездки.

Это всего лишь несколько возможных примеров применений задачи  коммивояжера из множества возможных задач оптимизаций, стоящих перед современным бизнесом и наукой . Известно, что поиск оптимального решения является NP-трудной задачей и существует (N-1)! различных возможных способов собрать решение с посещением N городов.

В настоящее время существует множество различных методов — как точных, так и эвристических — для эффективного поиска хороших решений. Подходы варьируются от эвристических моделей муравьиных колоний до чрезвычайно эффективных решателей (таких как Concorde), использующих сложные методы целочисленного линейного программирования для поиска точных решений.

 

Читать далее…

References

1. Электронный ресур https://www.math.uwaterloo.ca/tsp/pla85900/index.html Дата обращения 05.04.2023
2. Электронный ресур https://www.math.uwaterloo.ca/tsp/pla85900/compute/cpu.htm Дата обращения 23.04.2023
3. Пантелеев А.В., Метлицкая Д.В., Алешина Е.А. Методы глобальной оптимизации. Метаэвристические стратегии и алгоритмы. М.: Вузовская книга, 2013.
4. Reinforcement Learning: An Introduction. Second edition, in progress. Richard S. Sutton and Andrew G. Barto c 2014, 2015. A Bradford Book. The MIT Press.
5. Vijay R., Konda John N., Actor-Critic Algorithms – 2018. URL: https://arxiv.org/pdf/1801.01290.pdf
6. Электронный ресур https://spinningup.openai.com/en/latest/algorithms/sac.html
Дата обращения 02.05.2023
7. Tuomas Haarnoja, Haoran Tang, Pieter Abbeel, Sergey Levine – 2017. URL: https://arxiv.org/pdf/1702.08165.pdf