Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Какой микроконтроллер потянет распознавание лица?
Форум разработчиков электроники ELECTRONIX.ru > Микроконтроллеры (MCs) > ARM
_alex__
Какой минимальный по шкале стоимости микроконтроллер потянет распознавание лица?
А именно сначала нужно запомнить лицо владельца, а потом сравнивать с запомненным и выдать результат да или нет.
nanorobot
Цитата(_alex__ @ Jun 25 2018, 01:53) *
Какой минимальный по шкале стоимости микроконтроллер потянет распознавание лица?
А именно сначала нужно запомнить лицо владельца, а потом сравнивать с запомненным и выдать результат да или нет.


A11 Bionic ?
Aner
Вопрос слишком широкий, количественно некорректный совсем. Этой темой занимаются десятки IT компаний. Сегодня это и тема видео камер, IR камер, 3D камер, освещения и тд. Распознаваним лица занимаются мат. алгоритмы, также как и задачами каких либо видео верификаций. Разрешающая способность, точность, вероятность и др. параметры должна быть задана для тех DSP которые под это заточены. Также неплохо реализовать алгоритмы можно на FPGA.
Из специализирующихся компаний посмотрите в сторону https://www.ambarella.com/markets/applicati...fndtn-panel0501.
_alex__
Поставлю задачу более конкретно. Нужно найти минимальный контроллер, который потянет алгоритм позволяющий распознать лицо владельца(сохраненное в памяти) из видео потока, в котором площадь лица занимает не менее 10% кадра.
Разрешение кадров настолько минимально насколько необходимо для определения лицо владельца или нет с точностью 95%.
RadiatoR
Потянет хоть любой контроллер, лишь бы памяти программы хватило (и то решается внешней). Но вопрос ведь еще в том где хранятся исходные данные, время нахождения результата и много, много еще чего...
AlexandrY
Цитата(_alex__ @ Jun 24 2018, 23:53) *
Какой минимальный по шкале стоимости микроконтроллер потянет распознавание лица?
А именно сначала нужно запомнить лицо владельца, а потом сравнивать с запомненным и выдать результат да или нет.

Нормально не потянет никакой.
Даже мой S8 на Android 8 с вероятностью где-то 50 на 50 либо распознает либо нет.
HardEgor
Цитата(_alex__ @ Jun 25 2018, 15:00) *
Поставлю задачу более конкретно. Нужно найти минимальный контроллер, который потянет алгоритм позволяющий распознать лицо владельца(сохраненное в памяти) из видео потока, в котором площадь лица занимает не менее 10% кадра.
Разрешение кадров настолько минимально насколько необходимо для определения лицо владельца или нет с точностью 95%.

А причем здесь контроллер? Вы найдите вначале алгоритм, а потом и контроллер подбирать надо.
AVI-crak
Цитата(HardEgor @ Jun 25 2018, 14:48) *
А причем здесь контроллер? Вы найдите вначале алгоритм, а потом и контроллер подбирать надо.


Дык в этом проблема, алгоритмы распознавания лица по сохранённой векторной маске - не умещаются в обычный контролёр чисто физически.
Хотя их и можно утрамбовать - мало кто этим начнёт заниматься. С момента когда эти алгоритмы уже стали выдавать вменяемые данные - в них было внесено огромное количество дублирующего кода. Те самые полупустые библиотеки, фреймворки, куски кода на разных языках и наречиях и так далее. Вполне безобидная операция сложения может занимать килобайты кода - проверки на условия и ограничения под всеми углами. И такая фигня на каждой странице кода.

Удачи самоубийце, я пас.
twix
Обзор на Хабре, в комментах советуют OpenCV https://habr.com/company/synesis/blog/238129/
Реализация на Ардуино на базе OpenCV http://cxem.net/arduino/arduino27.php
Дипломная работа на ATMega238 на базе OpenCV https://sibsutis.ru/upload/2ae/%D0%9F%D0%972.docx

Ну и все, берете проект на ATMega328, анализируете и упихиваете проект в меньшую модель.
Так и найдете минимально возможный вариант.
Harvester
Цитата(twix @ Jun 26 2018, 05:36) *
Обзор на Хабре, в комментах советуют OpenCV https://habr.com/company/synesis/blog/238129/
Реализация на Ардуино на базе OpenCV http://cxem.net/arduino/arduino27.php
Дипломная работа на ATMega238 на базе OpenCV https://sibsutis.ru/upload/2ae/%D0%9F%D0%972.docx

Ну и все, берете проект на ATMega328, анализируете и упихиваете проект в меньшую модель.
Так и найдете минимально возможный вариант.

Не вводите людей в заблуждение! ATMega в этих проектах используется только для управления сервоприводом. Распознаванием занимается ПК.
mantech
Цитата(twix @ Jun 26 2018, 05:36) *
Обзор на Хабре, в комментах советуют OpenCV https://habr.com/company/synesis/blog/238129/
Реализация на Ардуино на базе OpenCV http://cxem.net/arduino/arduino27.php
Дипломная работа на ATMega238 на базе OpenCV https://sibsutis.ru/upload/2ae/%D0%9F%D0%972.docx

Ну и все, берете проект на ATMega328, анализируете и упихиваете проект в меньшую модель.
Так и найдете минимально возможный вариант.


Ой и впрямь посмеялся отдуши, распознование на меге biggrin.gif

Мало того, так комп там только само лицо определяет, а не сравнивает для опознания с оригиналом...

ЗЫ. Правильно ли понял, но для таких вещей нужен движок нейронной сети и ее обучение, куча процессорной мощности или исполькование облаков инет-гигантов...
HardEgor
Цитата(mantech @ Jun 26 2018, 15:11) *
ЗЫ. Правильно ли понял, но для таких вещей нужен движок нейронной сети и ее обучение, куча процессорной мощности или исполькование облаков инет-гигантов...

Обучение это одно, т.е. как-раз мощные компьютеры, гигантское количество обучающего материала и т.д.
А когда обученная сеть готова - вычислитель может быть на порядки проще. Тут уже встает вопрос - как быстро и много надо распознавать.
Может быть у автора идёт 1 кадр в секунду sm.gif
jcxz
Цитата(mantech @ Jun 26 2018, 11:11) *
ЗЫ. Правильно ли понял, но для таких вещей нужен движок нейронной сети и ее обучение, куча процессорной мощности или исполькование облаков инет-гигантов...

Недавно тут пробегало: https://electronix.ru/forum/index.php?showt...&hl=orlando
muravei
Цитата(mantech @ Jun 26 2018, 11:11) *
для таких вещей нужен движок нейронной сети и ее обучение, куча процессорной мощности или исполькование облаков инет-гигантов...

Китайский OPPO F7, например, разблокируется "узнавая" вас, и что, если не попасть в облако, то и не позвонить будет?
twix
Цитата(mantech @ Jun 26 2018, 09:11) *
Ой и впрямь посмеялся отдуши, распознование на меге biggrin.gif

Что выдает в вас полного дилетанта. Смеяться над тем что мега может распознавать может только человек,
который всерьез допускает такую возможность. Потому что для спецов это тупая шутка.
Мега безусловно не может распознавать, но мега в состоянии отправить запрос движку в облаках,
и получить ответ. Собственно это я и предположил, когда запостил ссылки, не вникая в смысл.

vovanse
А если попробовать OpenCV + Raspberry Pi?
mantech
Цитата(twix @ Jun 26 2018, 21:00) *
Что выдает в вас полного дилетанта. Смеяться над тем что мега может распознавать может только человек,
который всерьез допускает такую возможность. Потому что для спецов это тупая шутка.


Ну да, в распозновании образов я дилетант, эт точно.... Только вот шутка на самом деле - это вопрос ТС, ибо я еще ни разу не видел, чтоб отдельно взятое устройство, без подключения ко всяким гуглам, облакам и пр.. могло хорошо распознать просто речь, а уж про видео - так вообще лес темный, разве, что абсолютно не в реалтайме...
Corvus
Цитата(muravei @ Jun 26 2018, 20:50) *
Китайский OPPO F7, например, разблокируется "узнавая" вас, и что, если не попасть в облако, то и не позвонить будет?


Обычно после неудачных попыток можно ввести обычный пароль.

Я бы предложил начать с уровня nVidia Tegra. Их модули Jetson вполне доступны.
mantech
Цитата(muravei @ Jun 26 2018, 20:50) *
Китайский OPPO F7, например, разблокируется "узнавая" вас, и что, если не попасть в облако, то и не позвонить будет?

Оффтоп, но самое итересное, что при всех увлечениях сегодняшних прогеров всеми этими облаками и инетом, скоро так и будет - нет инета, подключения к облаку и пр.. и ваш телефон, планшет и пр - просто красивая коробочка... Все ее "мозги" в облаке, а у вас только бутлоадер biggrin.gif
muravei
Цитата(mantech @ Jun 27 2018, 17:26) *
просто красивая коробочка... Все ее "мозги" в облаке, а у вас только бутлоадер biggrin.gif

Тем не менее , физически эти "мозги" все крепчают...
Я , например, использую облако по прямому назначению- храню всякий хлам, типа одинокой лыжи sm.gif. Как чердак ,сарай или балкон.
Кстати, этот OPPO уже месяц как продается и можно полюбопытствовать у счастливых обладателей : сам он узнает владельца или с посторонней помощью.
Думаю, распознавание одного лица, желающего к тому же быть распознанным, не велика задача, на порядки проще чем распознавание речи.
Gorby
Цитата(Corvus @ Jun 27 2018, 12:52) *
Я бы предложил начать с уровня nVidia Tegra. Их модули Jetson вполне доступны.


Подтверждаю. Jetson TX1, TX2 имеют внутри ARM и Линукс (в т.ч. Убунту), а для специфических задач - отдельное графическое ядро.
Дают OpenCV библиотеку, завязанную на это ядро.
Задачи распознавания лиц, автономеров и проч решаются довольно весело.
Но скажем так, это не проект выходного дня.
khach
Если минимальны конфигурация - то STM32f7 c камерой.
https://www.youtube.com/watch?v=loa8dV_88UM
но на собственых ресурсах проца будет только несколько лиц распознавать.
Aner
QUOTE (khach @ Jun 28 2018, 11:36) *
Если минимальны конфигурация - то STM32f7 c камерой.
https://www.youtube.com/watch?v=loa8dV_88UM
но на собственых ресурсах проца будет только несколько лиц распознавать.

С вероятностью 3% ну 5%, пожалуй. А оно такое надо? На том демо, никак не рекогнайз фейс.
beard42
Цитата(khach @ Jun 28 2018, 10:36) *
Если минимальны конфигурация - то STM32f7 c камерой.
https://www.youtube.com/watch?v=loa8dV_88UM
но на собственых ресурсах проца будет только несколько лиц распознавать.

Не будет. Обратите внимание на 0:13. Там видно, что для распознавания используется Cognitive Service от Microsoft. Так что контроллер сам ничего не распознает.
khach
Цитата(Aner @ Jun 28 2018, 10:59) *
С вероятностью 3% ну 5%, пожалуй.

Нет, как раз вероятность достаточно высокая, проблема в библиотеке распознаваемых лиц. Если сигнатуры нет в памяти и ее приходиться искать на SD то время распознавания значительно удлиняется.
Ну и в данном варианте, когда камера смотрит с заданного положения нет необходимости заниматься поворотом и масштабированием изображения лица.
Вообще то программер говорил что можно и на STM32f429 сделать, но ресурсов уже очень сильно не хватет. Можно сделать на одну-две рожи замок. А без экрана быстрого отлаживать приложение распознавания трудно, поэтому на других STM32f4 не пытались делать.
Конечно на ютубе используется внешенне приложение- там проверялось наличие ресурсов для самой возможности приянять-передать изображение на сервер.
Gorby
Цитата(khach @ Jun 28 2018, 11:12) *
Можно сделать на одну-две рожи замок.


А замок на бедном ресурсами железе с таким функционалом делать вообще бессмысленно.
Потому как фотографию от живого человека такое поделие не отличает в принципе.

Вот потому и доминируют на рынке только две технологии в этом секторе (разграничение доступа по биометрике): глаз (iris\retina) и банальный отпечаток пальца.

Вот когда из толпы лицо преступника выхватить - это другое дело. Но тоже не для STM.
Aner
Это не так. На моем лаптопе, год как ему, распознавание лица владельца двумя камерами инфра и видео. Фоткой не, не открыть доступ. Если я в очках или без всеравно распознает.
khach
Цитата(Gorby @ Jun 28 2018, 11:24) *
Потому как фотографию от живого человека такое поделие не отличает в принципе.

Вы издеваетесь? Биометрика реперных точек снимается в обязательном порядке. Если нет пульса, то однозначно отказ в доступе. Т.е если вы даже труп лица с доступом предьявите камере, система вас пошлет.
По ресурсам это кстати совсем не напряжно.
_alex__
Цитата(khach @ Jun 28 2018, 09:43) *
Вы издеваетесь? Биометрика реперных точек снимается в обязательном порядке. Если нет пульса, то однозначно отказ в доступе. Т.е если вы даже труп лица с доступом предьявите камере, система вас пошлет.
По ресурсам это кстати совсем не напряжно.

Какие семейства микроконтроллеров потянут такое(в том числе определение наличия пульса)? Нужно два режима работы:
1) Человек смотрит прямо на камеру и система запоминает лицо
2) Система определяет: на камеру смотрит владелец или нет.
twix
Цитата(_alex__ @ Jun 28 2018, 22:46) *
Какие семейства микроконтроллеров потянут такое(в том числе определение наличия пульса)? Нужно два режима работы:
1) Человек смотрит прямо на камеру и система запоминает лицо
2) Система определяет: на камеру смотрит владелец или нет.

Вопросы не имеют смысла в принципе. Лицо человека крайне чувствительная часть тела к отекам и изменениям формы.
Укус комара, мошки, пчелы, удар об косяк или прилетело в репу от другого человека и все.
Все, лицо за двадцать минут раздует в произвольном направлении, заплывут скулы. веки, лоб и ни одна камера не узнает
измененную форму лица.
А получить в репу и из за этого не попасть домой, или там не завести собственную тачку чтобы попасть в медпункт,
что может быть глупее и опаснее...
mantech
Цитата(khach @ Jun 28 2018, 12:12) *
Конечно на ютубе используется внешенне приложение- там проверялось наличие ресурсов для самой возможности приянять-передать изображение на сервер.


Дак в том и дело, что передать изображение это процентов 5 от того, что требуется для его распознования, ну и стм для этих 5и процентов конечно достаточно laughing.gif
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.