Полтора года назад захотел сделать в labview свое распознавание. Находить лицо на потоке с вебкамеры ноутбука. Судя по датам виаек я делал это дня 4 на каникулах, потом настроение пропало. Сделать до конца у меня не получилось, но напишу вкратце логику и проблемы, раз уж тема схожа:)
Нейросеть делать в лабвью не захотелось, ген. алгоритмы тоже, решил забить на скорость и "прочувствовать" вначале медленный алгоритм, но сделать его самостоятельно. Решил сделать градиентный алгоритм (HOG). В первой половине статьи написано о чем, смотрится у девяти пикселей максимальный перепад интенсивности, в общем-то ничего особо умного
https://habr.com/post/306568/
- 1.png (12.06 КБ) 3395 просмотров
1. Цветное изображение много весит (долго обрабатывается) - выделял компоненту Value (интенсивность) - 8 бит стало.
1.1. Потом или пробовал лабвьюшные детекторы ставить (мне Собель нравился) или так оставлял. Затем считал у каждого пикселя вектор. Получается матрица цифр 0..9
2. Размерность матрицы получается большая, а в ней надо будет еще лицо искать. Нужно объединять, например, квадратом 5x5 и искать в нем самое частое значение.
3. Ну да, нафоткал себя, обрезал в пэинте лицо и рассчитал матрицы для лиц своих. Размеры масок разные получаются, нужно зная, что лицо постоянно, подобрать для каждой маски свою свертку. Ну и все
4. Ну а потом текущее изображение обрабатывается по 1,1.1, 2 и "по нему водится" шаблон - ища наибольшее совпадение.
Искало довольно долго. Иногда нормально находило, даже доволен был. Но далеко не всегда
1) Освещение сильно влияло, влючал лампу рядом с собой, сбивало.
2) Головой вертишь влево-вправо - плохо
3) Сильно все-таки зависит от расстояния до лица. Не смог корректно с масштабом сделать.
4) Долго считает. Сейчас вот увидел в кусках кода тройной цикл for. По всем маскам, С разными свертками, Поиск внутри матрицы.
5) Еще мелочей много... Понял очевидную вещь, что нужно действительно долго и плотно этим заниматься, чтобы хорошо сделать, решил не продолжать
Но к Вашей задачке могу советовать попробовать такой метод. Особенно, если камеру закрепите, шрифт примерно одинаковый, свет )