|
|
 |
Ответов
(45 - 59)
|
Mar 16 2007, 16:30
|
Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039

|
Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го.
|
|
|
|
|
Mar 17 2007, 00:25
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Цитата(CD_Eater @ Mar 16 2007, 15:01)  Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук!
Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции). Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. Я считаю, что даже распознавание Цитата фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся.
|
|
|
|
|
Mar 17 2007, 13:24
|

Electrical Engineer
     
Группа: СуперМодераторы
Сообщений: 2 163
Регистрация: 4-10-04
Пользователь №: 778

|
Цитата(SasaVitebsk @ Mar 17 2007, 00:25)  Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. :biggrin: изначально говорилось об этом: Цитата(VAHOO @ Mar 9 2007, 23:11)  мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответит можно через SD CARD или скажем ISD2560, но как распознавать речь? Цитата(SasaVitebsk @ Mar 17 2007, 00:25)  Я считаю, что даже распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся. ссылка уже приводилась в этом топике: http://instruct1.cit.cornell.edu/courses/e...ndex.html#introсделано именно на AVR . В таблицах 2-5 приведены вероятности правильного распознавания (результаты эксперимента). Исходники брать там же. И вводите в заблуждение людей..
--------------------
|
|
|
|
|
Mar 17 2007, 22:16
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
 Значит это я ввожу в заблуждение людей. И приведенный проект тому подтверждение. Когда на голову человека падает кирпич, то один скажет: боже, почему всё это падает на меня, - вот не везёт второй скажет: вот это повезло - другого бы убило Вы похоже скажете: блин чуть не попало. По-моему приведенный пример - ярчайшее подтверждение моих слов. Это ещё один пример, как потратив год работы можно лажануться. Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются. Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM".  Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. Хотя я бы не дал. Извините, но оттуда копировать просто НЕЧЕГО.
|
|
|
|
|
Mar 18 2007, 22:34
|

Electrical Engineer
     
Группа: СуперМодераторы
Сообщений: 2 163
Регистрация: 4-10-04
Пользователь №: 778

|
Цитата(SasaVitebsk @ Mar 17 2007, 22:16)  Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются. links, rechts (по произношению различаются не сильнее чем left/right) а вы предлагаете в качестве команд использовать слова вроде: "демобилизация", "идиосинкразия" ? кхм.. Цитата(SasaVitebsk @ Mar 17 2007, 22:16)  Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM".  Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. в качестве промежуточного результата могли и не такую вероятность получить.. при использовании обучения (см.далее в оригинальной статье) на словаре из 8ми слов получили минимальную вероятность распознавания в 85% (и то только на одном слове - более половины слов определяются с вероятностью в 100%). насчет цены - странно, вы к этому придрались.. это дипломный приект и в качестве справки просто приведена стоимость ВОМ. тут помоему должно быть всё ясно: железо отдельно - исследовательская работа отдельно. Цитата(SasaVitebsk @ Mar 17 2007, 22:16)  Извините, но оттуда копировать просто НЕЧЕГО. забыли добавить - "ИМХО". авторы использовали простейший подход - выделение полос фильтрами, однако приводят иные методы - улучшающие точность. да, и главное: как раз такие проекты (и тут скорее не как "проекты-для-копирования" а как "проекты-прецеденты") "когда (хоть и не 1) человек сделал на AVR и добился определенных результатов" и помогают снять ограничивающие убеждения, не позволяющие не только прочувствовать возможность реализации "в прнципе", но и мещающие инженеру быть эффективным (ставить творческие задачи, здраво оценивать трудоемкость, анализировать существующие разработки, штудировать (если придется) стопки литературы)
--------------------
|
|
|
|
|
Mar 19 2007, 15:29
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Цитата(CD_Eater @ Mar 19 2007, 00:44)  85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Да и люди, порядочные более чем на 85% в наше время - большая редкость.  По первому - то сотовый телефон, а то секьюрити. По второму - Вас видимо кто-то обидел.  Забавно когда ко мне менты приходят, а я их куда-нибудь пытаюсь перенаправить. Типовая фраза такая: - Саша тебе доверяю, а другим нет. - Почему? - Так кругом же бандиты!!! Не знаю вокруг меня "отличные люди". Всё таки порядочный человек на 85% - это уже непорядочный. К тому же после обучения.
|
|
|
|
|
Jan 1 2013, 01:56
|
Местный
  
Группа: Свой
Сообщений: 420
Регистрация: 22-12-04
Пользователь №: 1 608

|
Цитата(CD_Eater @ Mar 18 2007, 15:44)  85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Видимо сил-но зависит от системы. Голосовым набором я пользую только за рулем и там участвует встроенный BT, но цифры распознаются на 100%. Естественно все работает не на AVR  Что касается произвольного текста, то даже лучшие программы типа Dragon Dictate на много-гигагерцовых PC и полном словаре под рукой далеки от 100%.
|
|
|
|
|
Jan 1 2013, 09:03
|

Профессионал
    
Группа: Свой
Сообщений: 1 143
Регистрация: 30-09-08
Из: Новочеркасск
Пользователь №: 40 581

|
а в андроиде встроено распознавание - в моих попытках все мои слова, сказанные спокойно по одному слову, распознаются на 100%. насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы, но факт говорит сам за себя - отдельные слова распознаются отлично и безошибочно. что касается распознавания на AVR, то с определенными ограничениями мне эта задача представляется решаемой, т.к. были прецеденты на PIC, а PIC не далеко от AVR ушел, и даже скорее отстает в плане производительности: http://www.530.ru/electronics/projects.php?do=p124
--------------------
Я бы взял частями... но мне надо сразу.
|
|
|
|
|
Jan 10 2013, 06:41
|
Частый гость
 
Группа: Свой
Сообщений: 118
Регистрация: 3-12-06
Из: Новороссийск
Пользователь №: 23 082

|
Все придумано до нас. Чипы RSC-4128 фирмы Sensory. Подробно тут
|
|
|
|
|
Jan 10 2013, 11:48
|

Профессионал
    
Группа: Свой
Сообщений: 1 202
Регистрация: 26-08-05
Из: Донецк, ДНР
Пользователь №: 7 980

|
Цитата(ARV @ Jan 1 2013, 11:03)  я понял, это все делается через интернет Скорее всего. Вот тут - http://habrahabr.ru/post/146501/ делают через гугль и Wi-Fi (то бишь, интернет). Это, конечно, далеко не AVR, но, если надо, то и STM32 не жалко  .
--------------------
Чтобы возить такого пассажира, необходим лимузин другого класса. (с) Мария Эдуарда
|
|
|
|
|
  |
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|