|
|
  |
Синтезатор речи |
|
|
|
Mar 8 2007, 23:56
|
Частый гость
 
Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834

|
как можно сделать синтезатор речи скажем на AVR?
буду рад лубой информации
--------------------
Прошивка это душа микроконтроллера!
|
|
|
|
|
Mar 9 2007, 00:45
|

Профессионал
    
Группа: Свой
Сообщений: 1 065
Регистрация: 8-10-05
Из: Kiev, UA
Пользователь №: 9 380

|
Цитата как можно сделать синтезатор речи скажем на AVR? Воспроизводить звуки с достаточно высоким качеством AVR в состоянии. Взять хотя бы аппликэйшн цифровым диктофоном http://atmel.com/dyn/resources/prod_documents/doc1456.pdfостальное дело техники - использовать алгоритмы синтеза речи из готовых сэмплов.
--------------------
Вони шукають те, чого нема, Щоб довести, що його не існує.
|
|
|
|
|
Mar 9 2007, 23:11
|
Частый гость
 
Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834

|
мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответит можно через SD CARD или скажем ISD2560, но как распознавать реч?
--------------------
Прошивка это душа микроконтроллера!
|
|
|
|
|
Mar 10 2007, 00:22
|

Адепт
   
Группа: Свой
Сообщений: 520
Регистрация: 15-02-05
Пользователь №: 2 656

|
Цитата(VAHOO @ Mar 9 2007, 23:11)  мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответит можно через SD CARD или скажем ISD2560, но как распознавать реч? Вы бы определились - вам синтез или распознавание нужно? На АВРке нормальное распознавание не сделаешь, а вот при помощи процессоров от http://www.sensoryinc.com/ при условии ограниченного набора слов это вполне реально.
|
|
|
|
|
Mar 10 2007, 00:57
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Цитата(acex2 @ Mar 10 2007, 01:22)  Вы бы определились - вам синтез или распознавание нужно? На АВРке нормальное распознавание не сделаешь, а вот при помощи процессоров от http://www.sensoryinc.com/ при условии ограниченного набора слов это вполне реально. Реально для кого? Для вас или для вопрошающего? По-моему надо ясно человеку сказать. Хорошему коллективу имеющему приличные знания в разных областях потребуется пару лет для продукта более-менее пригодного к использованию.
|
|
|
|
|
Mar 10 2007, 02:29
|

Ambidexter
    
Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282

|
Народ, в пылу дискуссии не прибейте человека ненароком(:-). Его позиция совершенно ясная: он сказал, я спрошу контроллер, а он ответит, словом ли, делом ли. Цитата(VAHOO @ Mar 9 2007, 20:11)  мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответить можно через SD CARD или скажем ISD2560, но как распознавать речь? Найдите книгу, "Цифровые процессоры обработки сигналов". Под ред. Остапенко А.Г., 1994, 264с. Там есть приложение 1 "Пример проектирования модуля синтезатора речи на бис км1813ве1", приведено немного теории и программа синтеза речи (с.196-217). Процессор в приложении работает на частоте 6.144МГц, т.е. одна команда выполняется за 651 нс (4 клока), так что, как видите, современные аврки помощнее будут, особенно с командами, выполняемыми за 50 нс (20МГц такт). Всего 21 команда. Единственное преимущество у данного процессора - это длина аккумулятора - 25 бит. Теперь выбор за вами, сможете сделать синтезатор на авр или нет, так сказать, или грудь в крестах или голова в кустах. Решайтесь.
--------------------
Делай сразу хорошо, плохо само получится
|
|
|
|
|
Mar 10 2007, 10:35
|

Адепт
   
Группа: Свой
Сообщений: 520
Регистрация: 15-02-05
Пользователь №: 2 656

|
Цитата(SasaVitebsk @ Mar 10 2007, 00:57)  Реально для кого? Для вас или для вопрошающего? При помощи вот такой штуки http://www.sensoryinc.com/html/products/vrstamp.html даже начинающий сможет справиться с задачей. Необязательно иметь "хороший коллектив, имеющий приличные знания в разных областях", который будет все разрабатывать с нуля, когда есть готовые решения, уже разработанные другим "хорошим коллективом, имеющим приличные знания в разных областях".
|
|
|
|
|
Mar 10 2007, 14:15
|

Знающий
   
Группа: Участник
Сообщений: 845
Регистрация: 10-02-06
Пользователь №: 14 193

|
Цитата(VAHOO @ Mar 10 2007, 12:46)  а что вы думайте об этом?... ..."синтеза реци" Только для синтеза реци и подходят.  Я предложил вам сначала поиграться с говорилками, которым хватает только ресурсов компа. Если качеством удовлетворитесь, то смотрите в сторону ДСП. Но как сказали выше, самому вам это не сделать.
|
|
|
|
|
Mar 10 2007, 21:05
|
Участник

Группа: Новичок
Сообщений: 20
Регистрация: 10-03-07
Пользователь №: 26 032

|
Да... Посмеялся. Вообще-то мне попадались "говорящие часы" за 60 руб, да и телефон "Русь" разговаривает. Есть системы типа голосовой почты, они голосом сообщают куда нажать, человек нажимает... Думаю такой вариант более реален чем распознавание речи  А с распознавалками игрался - ничего путного  Сперва приучи его к своему голосу, пять раз каждое слово проговори (а их не меньше миллиона!) а потом он еще и путает...
|
|
|
|
|
Mar 12 2007, 02:13
|

Ambidexter
    
Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282

|
Цитата(Doka @ Mar 11 2007, 21:43)  Цитата(=GM= @ Mar 10 2007, 02:29)  ..Найдите книгу, "Цифровые процессоры обработки сигналов". Под ред. Остапенко А.Г., 1994, 264с. Там есть приложение 1 "Пример проектирования модуля синтезатора речи на бис км1813ве1", приведено немного теории и программа синтеза речи (с.196-217). где б еще найти ее.. ни поиск в веб, ни в пиринговых сетях не увенчались успехом  У меня есть бумажный экземпляр. Давай я тебе отсканирую оглавление, а ты выберешь, что конкретно тебе надо.
--------------------
Делай сразу хорошо, плохо само получится
|
|
|
|
|
Mar 12 2007, 11:40
|
Участник

Группа: Участник
Сообщений: 68
Регистрация: 19-07-06
Пользователь №: 18 918

|
В процессе прочтения. Возникла простая и тупая до ужаса идея. Не использовать реал-тайм. Записывать команду а потом обрабатывать. Если записать достаточно отсчетов, то с задачей рапознавания справится простой коррелятор, который вполне возможно собрать на меге. Если идея интересна то нужно запрячь матлаб. В принципе на меге даже адаптивную фильтрацию можно реализовать. Но работать все это будет очень медленно и достаточно криво.
|
|
|
|
|
Mar 12 2007, 14:40
|
Частый гость
 
Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834

|
за ответи спасибо! если не трудно мне тоже отправьте
vahagnh@rambler.ru
--------------------
Прошивка это душа микроконтроллера!
|
|
|
|
|
Mar 12 2007, 21:46
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Ребята, когда у меня спрашивают: "Можно ли реализовать то или это?", то ответ однозначный - "Да". Всегда. Вопрос в другом, - сколько времени сил и средств на это будет потрачено. Иными словами вопрос следует формулировать несколько иначе: "Целесообразно ли ... ?". Ответ будет - "НЕТ!" Для данной темы - с 99% вероятностью автор вопроса не справится с данной задачей и даже будет не в состоянии финансировать её завершение. Конечно, если говорить о сколько-нибудь коммерческом качестве.
Поэтому, подытоживая:
Да, реализовать можно, но придётся провести исследовательскую работу (включая спектральный анализ голосов десятков человек) большого объёма + изучить теорию значительного объёма + провести различное моделирование - И ПОТОМ ОПРЕДЕЛЯТСЯ ПО ПОВОДУ РЕАЛИЗАЦИИ. А именно выбрать камень для реализации и сопутствующие аппаратные ресурсы.
Реально это для одного человека? Да - если этому посвятить ВСЮ жизнь.
Такие темы так просто не отпускают! Если вы потратите лет 10 и добьётесь сколь-нибудь значимых успехов, то вас с руками оторвут коммерческие фирмы. Так как вы будете к этому моменту СПЕЦИАЛИСТОМ.
Надо ли вам это? Это решать вам.
|
|
|
|
|
Mar 12 2007, 22:39
|
Частый гость
 
Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834

|
по моему я не первый кто подумал об этом, я думаю что не может быть чтобы не было уже готовых таких проектов, я не хочу заного преобретать велосипед.
Может мы вместе придумаем ответ по этому поводу.
Я не хочу создать интеллектуальный апарат который будет понемать все что я скажу, просто мне надо что бы он понял некоторые команды (слова), и не только моим голосом.
По моему уже есть такие микросхемы распознавание речи.
--------------------
Прошивка это душа микроконтроллера!
|
|
|
|
|
Mar 13 2007, 00:16
|

Ambidexter
    
Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282

|
Цитата(Doka @ Mar 12 2007, 11:45)  Цитата(=GM= @ Mar 12 2007, 12:51)  Книга дома, вечером могу выложить, скажите только куда? можно попробовать залить на новый файловый сервис (кнопка "Загрузить файлы" в верхнем меню, доступ кнему имеют все участники) - потом просто сюда ссылку дадите. Вроде загрузил, файл: ostapenko.zip, 1827 КБ.
--------------------
Делай сразу хорошо, плохо само получится
|
|
|
|
|
Mar 13 2007, 17:23
|
Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039

|
2 SasaVitebsk Синтез речи - задача решаемая. Распознавание - нет. [/quote] Можно спросить каким образом реализовать простой синтез, даже роботизированный?
|
|
|
|
|
Mar 14 2007, 10:39
|
Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039

|
А где бы можно найти библиотеку фонем?
|
|
|
|
|
Mar 15 2007, 00:40
|

Ambidexter
    
Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282

|
Цитата(Doka @ Mar 14 2007, 09:52)  cпасибо!. еще бы разворот с.198-199 (продолжение П1.2) а вот ИМХО, все же проще по структурной схеме побыстрому в матлабе наваять модельку, чем ковыряться в 20страничном ассемблерном листинге, силясь понять как это работает...
единственное, что там наверное можно полезного почерпнуть - таблицу формант. Там меньше 7 страниц кода(:-). Если знаешь, что ваять, тогда проще, само собой разумеется... В общем я подумал-подумал, и копирнул всё приложение 1, пожал малёк, всего 3МБ на 22 страницы. Файл http://nukeuploads.com/download/1173907975...pendix.zip.htmlКод JEDYRJbcZF9yVRh
--------------------
Делай сразу хорошо, плохо само получится
|
|
|
|
|
Mar 15 2007, 13:19
|
Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039

|
Не так много, можно и поразбираться, но сначала нужно найти типа библиотеки формант или еще чего подобного. Без этого разбираться смысла нет.
|
|
|
|
|
Mar 16 2007, 01:29
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Цитата(trofim @ Mar 13 2007, 18:23)  2 SasaVitebsk Синтез речи - задача решаемая. Распознавание - нет.
Можно спросить каким образом реализовать простой синтез, даже роботизированный? Я не утверждал, что задача простая. Я написал - решаемая. Объясню почему. В общем случае МК нет необходимости знать что именно он произносит. В этом случае звучание будет не очень, но человек - опознает. В своё время я печатал один документ по DELFI. Меня интересовали потоки. Чтобы уменьшить колличество используемой бумаги я распечатал текст в виде брошуры (с помощью FinePrint) 4 листа на А4 лист. Ну и сижу читаю. Подходит ко мне сын. Долго смотрит, потом спрашивает что ты делаешь? Читаю. Я потом провёл эксперимент. Оказывается он не мог прочесть практически ни одного слова. При сжатии и дальнейшей печати символы исказились почти до неузнаваемости. При этом я прекрасно читал, и не замечал этого! Причина проста. Я понимал, что там написано, - он - нет! Что "скажет" МК - мы поймём даже при сильном искажении, а он будет ошибаться, даже если мы будем по слогам читать. Приведенные ссылки - это не мк. Там описаны мк С ПРОГРАМНЫМ ОБЕСПЕЧЕНИЕМ. Это стоит денег. А самим данные проги не разработать. Ещё раз утверждаю это работа серьёзного коллектива разработчиков на ГОДЫ. Да имеются частные решения для частных случаев. Для сведения: Распознавание речи не имеет ничего общего со сравнением спектров и спектральным анализом. Так только на звук разбитого стекла реагируют.  Распознавание речи что-то сродни распознаванию текста (ещё сложнее). Когда распознают букву "А", то её не сравнивают с образцом. Так как имеются различные фонты, есть рукописное написание, при написании может быть разрыв. Поэтому букву преобразуют в набор векторов и работают с векторами. Как не парадоксально, звуки тоже представляют в виде векторов. Дело в том, что буква имеет разный спектр в зависимости от того, где она стоит. (тоже и со слогами) Таким образом необходимо либо сравнивать целые слова либо подходить иначе. Обычно подходят иначе. Как - это вам никто не раскроет. Ещё раз поясняю. Дело не в написании программы. Программу напишет третьекурсник. Дело в громадной исследовательской работе, которую необходимо проделать, чтобы дать задание этому третьекурснику. Данная работа пока не проделана. Но даже когда она будет завершена, - радоваться не стоит. Не следует ждать, что будет выпущен специальный МК. Это должно быть интегрированное решение. МК+набор ПО для распознавания к примеру. И покупая его вы заплатите за МК, за ПО, за лицензию на алгоритм. Этот комплект в настоящий момент будет очень дорог! Так как тысячи предприятий были бы готовы его купить хоть сейчас. Кроме того данная задача требует огромных вычислительных ресурсов и большого объёма оперативной памяти. Я это оцениваю в мегабайты. Я думаю синтез с приемлемым качеством можно реализовать на AVR. Безусловно потребуются внешние элементы. Как минимум дополнительная флэш-память.
|
|
|
|
|
Mar 16 2007, 14:01
|
Частый гость
 
Группа: Новичок
Сообщений: 173
Регистрация: 3-09-04
Из: Moscow
Пользователь №: 595

|
Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук!
Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции).
|
|
|
|
|
Mar 16 2007, 16:30
|
Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039

|
Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го.
|
|
|
|
|
Mar 17 2007, 00:25
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Цитата(CD_Eater @ Mar 16 2007, 15:01)  Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук!
Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции). Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. Я считаю, что даже распознавание Цитата фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся.
|
|
|
|
|
Mar 17 2007, 13:24
|

Electrical Engineer
     
Группа: СуперМодераторы
Сообщений: 2 163
Регистрация: 4-10-04
Пользователь №: 778

|
Цитата(SasaVitebsk @ Mar 17 2007, 00:25)  Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. :biggrin: изначально говорилось об этом: Цитата(VAHOO @ Mar 9 2007, 23:11)  мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответит можно через SD CARD или скажем ISD2560, но как распознавать речь? Цитата(SasaVitebsk @ Mar 17 2007, 00:25)  Я считаю, что даже распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся. ссылка уже приводилась в этом топике: http://instruct1.cit.cornell.edu/courses/e...ndex.html#introсделано именно на AVR . В таблицах 2-5 приведены вероятности правильного распознавания (результаты эксперимента). Исходники брать там же. И вводите в заблуждение людей..
--------------------
|
|
|
|
|
Mar 17 2007, 22:16
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
 Значит это я ввожу в заблуждение людей. И приведенный проект тому подтверждение. Когда на голову человека падает кирпич, то один скажет: боже, почему всё это падает на меня, - вот не везёт второй скажет: вот это повезло - другого бы убило Вы похоже скажете: блин чуть не попало. По-моему приведенный пример - ярчайшее подтверждение моих слов. Это ещё один пример, как потратив год работы можно лажануться. Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются. Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM".  Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. Хотя я бы не дал. Извините, но оттуда копировать просто НЕЧЕГО.
|
|
|
|
|
Mar 18 2007, 22:34
|

Electrical Engineer
     
Группа: СуперМодераторы
Сообщений: 2 163
Регистрация: 4-10-04
Пользователь №: 778

|
Цитата(SasaVitebsk @ Mar 17 2007, 22:16)  Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются. links, rechts (по произношению различаются не сильнее чем left/right) а вы предлагаете в качестве команд использовать слова вроде: "демобилизация", "идиосинкразия" ? кхм.. Цитата(SasaVitebsk @ Mar 17 2007, 22:16)  Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM".  Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. в качестве промежуточного результата могли и не такую вероятность получить.. при использовании обучения (см.далее в оригинальной статье) на словаре из 8ми слов получили минимальную вероятность распознавания в 85% (и то только на одном слове - более половины слов определяются с вероятностью в 100%). насчет цены - странно, вы к этому придрались.. это дипломный приект и в качестве справки просто приведена стоимость ВОМ. тут помоему должно быть всё ясно: железо отдельно - исследовательская работа отдельно. Цитата(SasaVitebsk @ Mar 17 2007, 22:16)  Извините, но оттуда копировать просто НЕЧЕГО. забыли добавить - "ИМХО". авторы использовали простейший подход - выделение полос фильтрами, однако приводят иные методы - улучшающие точность. да, и главное: как раз такие проекты (и тут скорее не как "проекты-для-копирования" а как "проекты-прецеденты") "когда (хоть и не 1) человек сделал на AVR и добился определенных результатов" и помогают снять ограничивающие убеждения, не позволяющие не только прочувствовать возможность реализации "в прнципе", но и мещающие инженеру быть эффективным (ставить творческие задачи, здраво оценивать трудоемкость, анализировать существующие разработки, штудировать (если придется) стопки литературы)
--------------------
|
|
|
|
|
Mar 19 2007, 15:29
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Цитата(CD_Eater @ Mar 19 2007, 00:44)  85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Да и люди, порядочные более чем на 85% в наше время - большая редкость.  По первому - то сотовый телефон, а то секьюрити. По второму - Вас видимо кто-то обидел.  Забавно когда ко мне менты приходят, а я их куда-нибудь пытаюсь перенаправить. Типовая фраза такая: - Саша тебе доверяю, а другим нет. - Почему? - Так кругом же бандиты!!! Не знаю вокруг меня "отличные люди". Всё таки порядочный человек на 85% - это уже непорядочный. К тому же после обучения.
|
|
|
|
|
Jan 1 2013, 01:56
|
Местный
  
Группа: Свой
Сообщений: 420
Регистрация: 22-12-04
Пользователь №: 1 608

|
Цитата(CD_Eater @ Mar 18 2007, 15:44)  85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Видимо сил-но зависит от системы. Голосовым набором я пользую только за рулем и там участвует встроенный BT, но цифры распознаются на 100%. Естественно все работает не на AVR  Что касается произвольного текста, то даже лучшие программы типа Dragon Dictate на много-гигагерцовых PC и полном словаре под рукой далеки от 100%.
|
|
|
|
|
Jan 1 2013, 09:03
|

Профессионал
    
Группа: Свой
Сообщений: 1 143
Регистрация: 30-09-08
Из: Новочеркасск
Пользователь №: 40 581

|
а в андроиде встроено распознавание - в моих попытках все мои слова, сказанные спокойно по одному слову, распознаются на 100%. насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы, но факт говорит сам за себя - отдельные слова распознаются отлично и безошибочно. что касается распознавания на AVR, то с определенными ограничениями мне эта задача представляется решаемой, т.к. были прецеденты на PIC, а PIC не далеко от AVR ушел, и даже скорее отстает в плане производительности: http://www.530.ru/electronics/projects.php?do=p124
--------------------
Я бы взял частями... но мне надо сразу.
|
|
|
|
|
Jan 10 2013, 06:41
|
Частый гость
 
Группа: Свой
Сообщений: 118
Регистрация: 3-12-06
Из: Новороссийск
Пользователь №: 23 082

|
Все придумано до нас. Чипы RSC-4128 фирмы Sensory. Подробно тут
|
|
|
|
|
Jan 10 2013, 11:48
|

Профессионал
    
Группа: Свой
Сообщений: 1 202
Регистрация: 26-08-05
Из: Донецк, ДНР
Пользователь №: 7 980

|
Цитата(ARV @ Jan 1 2013, 11:03)  я понял, это все делается через интернет Скорее всего. Вот тут - http://habrahabr.ru/post/146501/ делают через гугль и Wi-Fi (то бишь, интернет). Это, конечно, далеко не AVR, но, если надо, то и STM32 не жалко  .
--------------------
Чтобы возить такого пассажира, необходим лимузин другого класса. (с) Мария Эдуарда
|
|
|
|
|
Jan 10 2013, 12:07
|

Местный
  
Группа: Свой
Сообщений: 329
Регистрация: 22-06-04
Пользователь №: 124

|
Цитата STM32 не жалко можно и "безплатно", напрмер посредством своего смартфона ...
--------------------
Талант не пропить ...
|
|
|
|
|
Mar 10 2013, 19:17
|
Группа: Новичок
Сообщений: 6
Регистрация: 30-12-12
Пользователь №: 75 024

|
Цитата(trofim @ Mar 16 2007, 20:30)  Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го. Исходники е ? Если нет исходников для speek_r.com то можно тупо перелопатить весь DOSовский EXEшник под нужный процессор , вставляя NOPы дабы не сбить переходы типа JMP , так как длина команд под разные архитектуры процессоров может розниться. Причём транслятор можно написать самому на каком-либо примитивном ЯВУ . Я , когда ускорял speeck_r.com, даже не задумывался как он работает в целом! Нашёл где speeck_r.com выдаёт на 42h звуковой порт, применил 5 идей/приёмов ( см. описание : http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s ) , 1 год возьни с ним , и всё нормально --- любой далёкий от программирования и компьютеров человек различает его речь с 1 раза ! А без "отладки" комп не говорит вообще
|
|
|
|
|
Mar 17 2013, 11:06
|
Группа: Новичок
Сообщений: 6
Регистрация: 30-12-12
Пользователь №: 75 024

|
Цитата(DUB00035 @ Dec 30 2012, 19:26)  Оптимизация Синтезатора Речи ---возможно кого-либо заинтересует: http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5sДля убыстрения синтезатора пришлось заполнять буфер операцией Push --- стрёмный такой способ.
|
|
|
|
|
Mar 17 2013, 19:02
|
Группа: Новичок
Сообщений: 6
Регистрация: 30-12-12
Пользователь №: 75 024

|
Цитата(trofim @ Mar 16 2007, 20:30)  Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го. Причём голоса рускоговорящих всех DOSовских синтезаторов абсолютно идентичны---будь то speeck , SAY.EXE или Demosfen . Я смотрел коды их --- коды похожи очень. Такое ощущение , что у них единый праПраПраИсходник  или/и в их основе Общая диссертация по синтезу звука . Не подскажите , а 1 из вариантов Вашего Sdrv.com случайно не 42636 байт весит ? Дело в том , что у меня такого размера какой-то Synt, и я собираюсь им заняться
|
|
|
|
|
Mar 23 2013, 16:48
|
Группа: Участник
Сообщений: 11
Регистрация: 30-01-13
Пользователь №: 75 410

|
В свое время дизассемблировал SDRV. и по аналогии написал один к одному (почти) для AVR. Качество работы меня и моих подопытных вполне устроило. Свободного ресурса навалом. Кому надо забирайте.
Прикрепленные файлы
sdrv.zip ( 204.18 килобайт )
Кол-во скачиваний: 94
|
|
|
|
|
Jun 3 2014, 12:45
|
Группа: Новичок
Сообщений: 6
Регистрация: 30-12-12
Пользователь №: 75 024

|
Цитата(DUB00035 @ Dec 30 2012, 23:36)  Оптимизация Синтезатора Речи ---возможно кого-либо заинтересует: http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s Изменена Xlat-таблица : теперь на 42h Порт идут только такие значения --- 00000001b или 00000000b ... Звучит также !
|
|
|
|
|
  |
3 чел. читают эту тему (гостей: 3, скрытых пользователей: 0)
Пользователей: 0
|
|
|