Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Синтезатор речи
Форум разработчиков электроники ELECTRONIX.ru > Микроконтроллеры (MCs) > AVR
Страницы: 1, 2
SasaVitebsk
Не буду с вами спорить. У нас просто разные взгляды на вещи. Например человеку, который порядочный на 85% после обучения, - я бы деньги не отдал. Но собственно не о том разговор.

Этот проект всё равно не подойдёт для начинающего. (А разбирающийся за него сам не возьмётся) Причина проста. Даже перевести его на русский словарь (насколько я понял при беглом просмотре) - это уже не совсем простая операция требующая определённых знаний отнюдь не в программировании.

И ещё повторюсь. На вопрос "можно ли?" - отвечу "да" На вопрос "целесообразно ли?" - отвечу "нет". Причина - надо длительные и трудоёмкие исследования.
CD_Eater
85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью

Да и люди, порядочные более чем на 85% в наше время - большая редкость. wink.gif
SasaVitebsk
Цитата(CD_Eater @ Mar 19 2007, 00:44) *
85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью

Да и люди, порядочные более чем на 85% в наше время - большая редкость. wink.gif


По первому - то сотовый телефон, а то секьюрити. smile.gif

По второму - Вас видимо кто-то обидел. smile.gif Забавно когда ко мне менты приходят, а я их куда-нибудь пытаюсь перенаправить. Типовая фраза такая:
- Саша тебе доверяю, а другим нет.
- Почему?
- Так кругом же бандиты!!! blink.gif

biggrin.gif
Не знаю вокруг меня "отличные люди". biggrin.gif


Всё таки порядочный человек на 85% - это уже непорядочный. К тому же после обучения. biggrin.gif
DUB00035
Оптимизация Синтезатора Речи
---возможно кого-либо заинтересует:
http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s
alexf
Цитата(CD_Eater @ Mar 18 2007, 15:44) *
85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью


Видимо сил-но зависит от системы. Голосовым набором я пользую только за рулем и там участвует встроенный BT, но цифры распознаются на 100%. Естественно все работает не на AVR sm.gif

Что касается произвольного текста, то даже лучшие программы типа Dragon Dictate на много-гигагерцовых PC и полном словаре под рукой далеки от 100%.
perfect
Вообще не в теме, но думаю что если распознающий не понимает говорящего, то говорящему нужно снизойти до распознающего.
Простейший расппознающий, я думаю, где-то на двоичном уровне, что-то вроде морзянки, RC5 протокола для телевизоров или DiSEqC sm.gif
Ну, ничё не поделааешь, говорящему придётся издавать пачки звуков-пауз из очень ограниченного лексикона. rolleyes.gif
ARV
а в андроиде встроено распознавание - в моих попытках все мои слова, сказанные спокойно по одному слову, распознаются на 100%. насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы, но факт говорит сам за себя - отдельные слова распознаются отлично и безошибочно.

что касается распознавания на AVR, то с определенными ограничениями мне эта задача представляется решаемой, т.к. были прецеденты на PIC, а PIC не далеко от AVR ушел, и даже скорее отстает в плане производительности: http://www.530.ru/electronics/projects.php?do=p124
perfect
Цитата(ARV @ Jan 1 2013, 13:03) *
насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы

Колоссальные ресурсы можно представить и как колоссальные людские ресурсы biggrin.gif
LexaK
Все придумано до нас. Чипы RSC-4128 фирмы Sensory.
Подробно тут
hd44780
Цитата(ARV @ Jan 1 2013, 11:03) *
я понял, это все делается через интернет

Скорее всего.
Вот тут - http://habrahabr.ru/post/146501/ делают через гугль и Wi-Fi (то бишь, интернет). Это, конечно, далеко не AVR, но, если надо, то и STM32 не жалко biggrin.gif .
Hmm
Цитата
STM32 не жалко
можно и "безплатно", напрмер посредством своего смартфона ...
MALLOY2
Может у них спросить, как это просто ?
http://newsdesk.pcmag.ru/node/5975
DUB00035
Цитата(trofim @ Mar 16 2007, 20:30) *
Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го.

Исходники е ? Если нет исходников для speek_r.com то можно тупо перелопатить весь DOSовский EXEшник под нужный процессор , вставляя NOPы дабы не сбить
переходы типа JMP , так как длина команд под разные архитектуры процессоров может розниться. Причём транслятор можно написать самому на каком-либо
примитивном ЯВУ . Я , когда ускорял speeck_r.com, даже не задумывался как он работает в целом! Нашёл где speeck_r.com выдаёт на 42h звуковой порт,
применил 5 идей/приёмов ( см. описание : http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s ) , 1 год возьни с ним ,
и всё нормально --- любой далёкий от программирования и компьютеров человек различает его речь с 1 раза ! А без "отладки" комп не говорит вообще
DUB00035
Цитата(DUB00035 @ Dec 30 2012, 19:26) *
Оптимизация Синтезатора Речи
---возможно кого-либо заинтересует:
http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s

Для убыстрения синтезатора пришлось заполнять буфер операцией Push --- стрёмный такой способ.
DUB00035
Цитата(trofim @ Mar 16 2007, 20:30) *
Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го.

Причём голоса рускоговорящих всех DOSовских синтезаторов абсолютно идентичны---будь то speeck ,
SAY.EXE или Demosfen . Я смотрел коды их --- коды похожи очень. Такое ощущение , что у них единый
праПраПраИсходник biggrin.gif или/и в их основе Общая диссертация по синтезу звука . Не подскажите ,
а 1 из вариантов Вашего Sdrv.com случайно не 42636 байт весит ? Дело в том , что у меня такого размера
какой-то Synt, и я собираюсь им заняться
trofim2
В свое время дизассемблировал SDRV. и по аналогии написал один к одному (почти) для AVR.
Качество работы меня и моих подопытных вполне устроило. Свободного ресурса навалом. Кому надо забирайте.
DUB00035
Цитата(DUB00035 @ Dec 30 2012, 23:36) *
Оптимизация Синтезатора Речи
---возможно кого-либо заинтересует:
http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s
Изменена Xlat-таблица : теперь на 42h Порт идут только такие значения --- 00000001b или 00000000b ... Звучит также !
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.