Investigation of object recognition algorithms on video images using video analytics

UDC 004.93'1
Publication date: 29.12.2020
International Journal of Professional Science №12-2020

Investigation of object recognition algorithms on video images using video analytics

Исследование алгоритмов распознавания объектов на видеоизображении с использованием видеоаналитики

Aptsiauri Aleksandr Vyacheslavovich
Andreev Roman Aleksandrovich
Fedorov Andrey Sergeevich
Scientific adviser: Vorobiev O.V.
1. Graduate Student of Department of University ITMO
2. Head of Research and Education Center «Wireless Infotelecommunication Networks», SPbSUT
3. Graduate Student of Department of Radio Communication and Broadcasting, SPbSUT
4. Cand. Of Eng. Sc., professor,
head of Department of Radio Communication and Broadcasting, SPbSUT


Апциаури Александр Вячеславович
Андреев Роман Александрович
Федоров Андрей Сергеевич,
Научный руководитель - Воробьев О.В.

1. Магистрант СПбНИУ ИТМО
2. Начальник научно-образовательного центра «Беспроводные инфотелекоммуникационные сети», СПбГУТ им. проф. М.А. Бонч-Бруевича
3. Магистрант кафедры радиосвязи и вещания, СПбГУТ им. проф. М.А. Бонч-Бруевича
4. к.т.н., профессор, заведующей кафедрой радиосвязи и вещания,
СПбГУТ им. проф. М.А. Бонч-Бруевича
Аннотация: Распознавание объектов все чаще используется человечеством в самых различных сферах деятельности, например, выявление наиболее интересных зон для покупателей, контроль за помещением, охрана предприятий, а также доступ к смартфону. В данной статье кратко описаны некоторые алгоритмы распознавания лиц, а также описаны методы работы алгоритмов.

Abstract: Object recognition is increasingly being used by humanity in a wide variety of areas of activity, for example, identifying the most interesting areas for customers, room control, enterprise security, and access to a smartphone. This article briefly describes some facial recognition algorithms, as well as methods of operating algorithms.
Ключевые слова: распознавание, LBPH, Eigenfaces, Fisherfaces

Keywords: recognition, LBPH, Eigenfaces, Fisherfaces


Видеоаналитика – технология, которая использует методы и решения компьютерного интеллекта и зрения для получения различного рода данных с последующим анализом изображений, получаемых с камер видеонаблюдения в режиме реального времени, сохраненных видеозаписей или фотографий.

Видеоаналитика представляет собой программное обеспечение, работающее с видеопотоком, основой проекта служат алгоритмы машинного зрения и интеллекта, которые работают без прямого контакта с человеком. В современном обществе из-за огромного человеческого трафика трудно уследить за разного рода событиями и изменениями в жизни общества, именно для упрощения мониторинга за этими событиями и была создана видеоаналитика, позволяющая значительно упростить и повысить продуктивность работы сотрудников.

Существует несколько самых популярных алгоритмов распознавания:

  • Алгоритм Eigenfaces;
  • Алгоритм Fisherfaces;
  • Алгоритм LBPH (Local Binary Pattern Histogram).

Алгоритм Eigenfaces основан на принципе главных компонент (англ. Principal compоnent analysis, PCA) [1]. Основная задача алгоритма состоит в уменьшении объема и размера поступающей информации без ущерба основной информации [2]. Стоит описать наиболее простой вариант работы алгоритма:

  • Имея некоторую обучающую подборку из I определенного количества изображений определенного размера y необходимо представить в виде квадратной матрицы y на y, для этого необходимо совершить своего рода вытягивание каждого изображения в вектор длинной y. После этого действия каждый вектор образует столбец в матрице, стоит заметить, что нехватку y – I столбцов нужно заполнить нулями [1].
  • Следующим шагом важно осуществить вычисление собственного вектора данной матрицы и упорядочить их в порядке убывания аналогичных им собственных значений. Это уже можно назвать «собственные лица»[2].
  • Далее необходимо взять J начальных векторов, делается это по “правилу сломанной трости”.

Пример полученного изображения представлен на рисунке 1.

Рисунок 1. Пример полученного изображения (Eigenfaces)

Алгоритм Fisherfaces – это метод, основанный на Линейном дискриминантном анализе (англ. The Linear Discriminant Analysis) [3]. Суть работы данного алгоритма состоит в том, чтобы выполнить уменьшение размерности для каждого класса. Чтобы найти комбинацию признаков, которая лучше всего разделяет классы, линейный дискриминантный анализ максимизирует соотношение между классами к разбросу внутри классов, а не максимизирует общий разброс [4]. Принцип работы данного алгоритма схож с работой Eigenfaces. Пример полученного изображения представлен на рисунке 2.

Рисунок 2. Пример полученного изображения (Fisherfaces)

Алгоритм Local Binary Patterns Histograms (LBPH) предполагает суммирование локальных структур изображения путем сравнения каждого пикселя со смежными. Применение LBPH: начальное вычислительное действие алгоритма основывается на создании переходного изображения, которое описывает исходное изображение путем подчеркивая черт лица того или иного человека. Осуществляется это при помощи параметров LBPH: радиуса и соседей. [5].

Описание работы алгоритма выглядит следующим образом:

  • При черно-белой цветовой гамме необходимо воспользоваться возможностью получения части изображения размером 3х3 пикселя.
  • Также этот квадрат 3х3 пикселя можно представить в виде матрицы, которая содержит интенсивность пикселей от 0 до 255.
  • Далее необходимо обозначить центральное значение матрицы, которое в последствии будет использоваться как пороговое значение.
  • Благодаря пороговому значению становится возможным определение новых значений из окружающих его 8 соседей.
  • Теперь имеет смысл для каждого из 8 соседей центрального порога установить двоичное значение. Для тех соседей, которые равны или превышают центральный порог присваивается – 1, а для тех, которые ниже порогового – 0.
  • После этих действий матрица состоит из двоичных значений (центральные пороговое значение не учитывается). Предстоит объединить данные двоичные значения строка за строкой для получения нового.
  • На данном этапе необходимо перевести полученное двоичное число в десятичное, затем необходимо разместить его в центральное значение матрицы, которое можно назвать своего рода пикселем входного изображения.
  • В конце LBP получается уже новое изображение, но при всем этом оно лучше отображает параметры входного изображения.

Пример полученного изображения представлен на рисунке 3.

Рисунок 3. Пример полученного изображения (LBPH)

Таким образом, в данной статье были рассмотрены основные алгоритмы распознавания, их принцип работы и представлены примеры полученных на их основе изображений.

References

1. MH Yang (2000). "Face Recоgnitiоn с помощью eigenfaces ядра". Труды Международной конференции по обработке изображений. 1. стр. 37-40.
2. М. Турок; А. Pentland (1991). "Eigenfaces для распознавания". Журнал когнитивной неврологии. 3 (1): 71-86.
3. Belhumeur, P. N., Hespanha, J., and Kriegman, D. Eigenfaces vs. Fisherfaces: Recоgnitiоn Using Class Specific Linear Prоjectiоn. IEEET transactiоns оn Pattern Analysis and Machine Intelligence 19, 7 (1997), 711–720.
4. Martinez, A and Kak, A. PCA versus LDA IEEE Transactiоns оn Pattern Analysis and Machine Intelligence, Vоl. 23, Nо.2, pp. 228-233, 2001.
5. Ahоnen, T., Hadid, A., and Pietikainen, M. Face Recоgnitiоn with Lоcal Binary Patterns. Cоmputer Visiоn - ECCV 2004 (2004), 469–481.