Аналитика и Data Science Программирование

Создание модели распознавания лиц с использованием глубокого обучения на языке Python

Адаптировали статью Файзана Шайха о том, как создать модель распознавания лиц и в каких сферах её можно применять.

Елена Борноволокова

Переводчик

За последние годы компьютерное зрение набрало популярность и выделилось в отдельное направление. Разработчики создают новые приложения, которыми пользуются по всему миру.

В этом направлении привлекает концепция открытого исходного кода. Даже технологические гиганты готовы делиться новыми открытиями и инновациями со всеми, чтобы технологии не оставались привилегией богатых.

Одна из таких технологий — распознавание лиц. При правильном и этичном использовании эта технология может применяться во многих сферах жизни.

В этой статье покажем, как создать эффективный алгоритм распознавания лиц, используя инструменты с открытым исходным кодом. Прежде чем перейти к этой информации, хотим, чтобы вы подготовились и испытали вдохновение, посмотрев это видео:

Распознавание лиц: потенциальные сферы применения

Приведу несколько потенциальных сфер применения технологии распознавания лиц.

Распознавание лиц в соцсетях. Facebook заменил присвоение тегов изображениям вручную на автоматически генерируемые предложения тегов для каждого изображения, загружаемого на платформу. Facebook использует простой алгоритм распознавания лиц для анализа пикселей на изображении и сравнения его с соответствующими пользователями.

Распознавание лиц в сфере безопасности. Простой пример использования технологии распознавания лиц для защиты личных данных — разблокировка смартфона «по лицу». Такую технологию можно внедрить и в пропускную систему: человек смотрит в камеру, а она определяет, разрешить ему войти или нет.

Распознавание лиц для подсчёта количества людей. Технологию распознавания лиц можно использовать при подсчёте количества людей, посещающих какое-либо мероприятие (например, конференцию или концерт). Вместо того чтобы вручную подсчитывать участников, устанавливаем камеру, которая может захватывать изображения лиц участников и выдавать общее количество посетителей. Это поможет автоматизировать процесс и сэкономить время.

Настройка системы: требования к аппаратному и программному обеспечению

Рассмотрим, как можно использовать технологию распознавания лиц, обратившись к доступным инструментам с открытым исходным кодом.

Я использовал следующие инструменты, которые рекомендую вам:

  • Веб-камера (Logitech C920) для построения модели распознавания лиц в реальном времени на ноутбуке Lenovo E470 ThinkPad (Core i5 7th Gen). Вы также можете использовать встроенную камеру своего ноутбука или видеокамеру с любой подходящей системой для анализа видео в режиме реального времени вместо тех, которые использовал я.
  • Предпочтительно использовать графический процессор для более быстрой обработки видео.
  • Мы использовали операционную систему Ubuntu 18.04 с необходимым ПО.

Прежде чем приступить к построению нашей модели распознавания лиц, разберём эти пункты более подробно.

Шаг 1. Настройка аппаратного обеспечения

Проверьте, правильно ли настроена камера. С Ubuntu это сделать просто: посмотрите, опознано ли устройство операционной системой. Для этого выполните следующие шаги:

1. Прежде чем подключить веб-камеру к ноутбуку, проверьте подключенные видеоустройства, напечатав в командной строке ls /dev/video*. В результате выйдет список всех устройств, подключенных к системе. 

2. Подключите веб-камеру и задайте команду снова. Если веб-камера подключена правильно, новое устройство будет отражено в результате выполнения команды.

3. Также можете использовать ПО веб-камеры для проверки её корректной работы. В Ubuntu для этого можно использовать программу «Сheese».

Шаг 2. Настройка программного обеспечения

Шаг 2.1. Установка Python

Код, указанный в этой статье, написан с использованием Python (версия 3.5). Для установки Python рекомендую использовать Anaconda – популярный дистрибутив Python для обработки и анализа данных.

Шаг 2.2. Установка OpenCV

OpenCV – библиотека с открытым кодом, которая предназначена для создания приложений компьютерного зрения. Установка OpenCV производится с помощью pip:

pip3 install opencv-python

Шаг 2.3. Установите face_recognition API

Мы будем использовать face_recognition API, который считается самым простым API для распознавания лиц на Python во всём мире. Для установки используйте:

pip install dlib

pip install face_recognition

Внедрение

После настройки системы переходим к внедрению. Для начала создадим программу, а затем объясним, что сделали.

Пошаговое руководство

Создайте файл face_detector.py и затем скопируйте приведённый ниже код:

Затем запустите этот файл Python, напечатав:

python face_detector.py

Если всё работает правильно, откроется новое окно с запущенным режимом распознавания лиц в реальном времени.

Подведём итоги и объясним, что сделал наш код:

  • Сначала мы указали аппаратное обеспечение, на котором будет производиться анализ видео.
  • Далее сделали захват видео в реальном времени – кадр за кадром.
  • Затем обработали каждый кадр и извлекли местонахождение всех лиц на изображении.
  • В итоге, воспроизвели эти кадры в форме видео вместе с указанием на то, где расположены лица.

курс

DEEP 
LEARNING 🦾

Узнать больше

  • От персептрона до GAN’ов: только практические кейсы
  • Добавите более 20 рабочих проектов в портфолио
  • Гибкая учебная траектория, поддержка сообщества экспертов, консультации с ментором

Пример применения технологии распознавания лиц

На этом всё самое интересное не заканчивается 😉 Мы сделаем еще одну классную вещь: создадим полноценный пример применения на основе кода, приведённого выше. Внесём небольшие изменения в код, и всё будет готово.

Предположим, что вы хотите создать автоматизированную систему с использованием видеокамеры для отслеживания, где спикер находится в данный момент времени. В зависимости от его положения, система поворачивает камеру так, что спикер всегда остаётся в центре кадра.

Первый шаг — создайте систему, которая идентифицирует человека или людей на видео и фокусируется на местонахождении спикера.

Разберём, как это сделать. В качестве примера я выбрал видео на YouTube с выступлением спикеров конференции «DataHack Summit 2017».

Сначала импортируем необходимые библиотеки:

Затем считываем видео и устанавливаем длину:

После этого создаём файл вывода с необходимым разрешением и скоростью передачи кадров, аналогичной той, что была в файле ввода.

Загружаем изображение спикера в качестве образца для распознания его на видео:

Закончив, запускаем цикл, который будет:

  • извлекать кадр из видео;
  • находить и идентифицировать все лица;
  • создавать новое видео, которое будет сочетать в себе оригинал кадра с указанием местонахождения лица спикера с подписью.

Посмотрим на код, который будет это выполнять:

Код даст вот такой результат:


Мнение автора и редакции может не совпадать. Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Елена Борноволокова

Переводчик