Форум разработчиков электроники ELECTRONIX.ru

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: Синтезатор речи

Форум разработчиков электроники ELECTRONIX.ru > Микроконтроллеры (MCs) > AVR

Страницы: 1, 2

SasaVitebsk

Mar 18 2007, 23:06

Не буду с вами спорить. У нас просто разные взгляды на вещи. Например человеку, который порядочный на 85% после обучения, - я бы деньги не отдал. Но собственно не о том разговор.

Этот проект всё равно не подойдёт для начинающего. (А разбирающийся за него сам не возьмётся) Причина проста. Даже перевести его на русский словарь (насколько я понял при беглом просмотре) - это уже не совсем простая операция требующая определённых знаний отнюдь не в программировании.

И ещё повторюсь. На вопрос "можно ли?" - отвечу "да" На вопрос "целесообразно ли?" - отвечу "нет". Причина - надо длительные и трудоёмкие исследования.

CD_Eater

Mar 18 2007, 23:44

85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью

Да и люди, порядочные более чем на 85% в наше время - большая редкость.

SasaVitebsk

Mar 19 2007, 15:29

Цитата(CD_Eater @ Mar 19 2007, 00:44)

По первому - то сотовый телефон, а то секьюрити.

По второму - Вас видимо кто-то обидел.

Забавно когда ко мне менты приходят, а я их куда-нибудь пытаюсь перенаправить. Типовая фраза такая:
- Саша тебе доверяю, а другим нет.
- Почему?
- Так кругом же бандиты!!!

Не знаю вокруг меня "отличные люди".

Всё таки порядочный человек на 85% - это уже непорядочный. К тому же после обучения.

DUB00035

Dec 30 2012, 15:26

Оптимизация Синтезатора Речи
---возможно кого-либо заинтересует:
http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s

alexf

Jan 1 2013, 01:56

Цитата(CD_Eater @ Mar 18 2007, 15:44)

Видимо сил-но зависит от системы. Голосовым набором я пользую только за рулем и там участвует встроенный BT, но цифры распознаются на 100%. Естественно все работает не на AVR

Что касается произвольного текста, то даже лучшие программы типа Dragon Dictate на много-гигагерцовых PC и полном словаре под рукой далеки от 100%.

perfect

Jan 1 2013, 08:17

Вообще не в теме, но думаю что если распознающий не понимает говорящего, то говорящему нужно снизойти до распознающего.
Простейший расппознающий, я думаю, где-то на двоичном уровне, что-то вроде морзянки, RC5 протокола для телевизоров или DiSEqC

Ну, ничё не поделааешь, говорящему придётся издавать пачки звуков-пауз из очень ограниченного лексикона.

ARV

Jan 1 2013, 09:03

а в андроиде встроено распознавание - в моих попытках все мои слова, сказанные спокойно по одному слову, распознаются на 100%. насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы, но факт говорит сам за себя - отдельные слова распознаются отлично и безошибочно.

что касается распознавания на AVR, то с определенными ограничениями мне эта задача представляется решаемой, т.к. были прецеденты на PIC, а PIC не далеко от AVR ушел, и даже скорее отстает в плане производительности: http://www.530.ru/electronics/projects.php?do=p124

perfect

Jan 1 2013, 09:21

Цитата(ARV @ Jan 1 2013, 13:03)

насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы

Колоссальные ресурсы можно представить и как колоссальные людские ресурсы

LexaK

Jan 10 2013, 06:41

Все придумано до нас. Чипы RSC-4128 фирмы Sensory.
Подробно тут

hd44780

Jan 10 2013, 11:48

Цитата(ARV @ Jan 1 2013, 11:03)

я понял, это все делается через интернет

Скорее всего.
Вот тут - http://habrahabr.ru/post/146501/ делают через гугль и Wi-Fi (то бишь, интернет). Это, конечно, далеко не AVR, но, если надо, то и STM32 не жалко

Hmm

Jan 10 2013, 12:07

Цитата

STM32 не жалко

можно и "безплатно", напрмер посредством своего смартфона ...

MALLOY2

Jan 10 2013, 12:30

Может у них спросить, как это просто ?
http://newsdesk.pcmag.ru/node/5975

DUB00035

Mar 10 2013, 19:17

Цитата(trofim @ Mar 16 2007, 20:30)

Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го.

Исходники е ? Если нет исходников для speek_r.com то можно тупо перелопатить весь DOSовский EXEшник под нужный процессор , вставляя NOPы дабы не сбить
переходы типа JMP , так как длина команд под разные архитектуры процессоров может розниться. Причём транслятор можно написать самому на каком-либо
примитивном ЯВУ . Я , когда ускорял speeck_r.com, даже не задумывался как он работает в целом! Нашёл где speeck_r.com выдаёт на 42h звуковой порт,
применил 5 идей/приёмов ( см. описание : http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s ) , 1 год возьни с ним ,
и всё нормально --- любой далёкий от программирования и компьютеров человек различает его речь с 1 раза ! А без "отладки" комп не говорит вообще

DUB00035

Mar 17 2013, 11:06

Цитата(DUB00035 @ Dec 30 2012, 19:26)

Оптимизация Синтезатора Речи
---возможно кого-либо заинтересует:
http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s

Для убыстрения синтезатора пришлось заполнять буфер операцией Push --- стрёмный такой способ.

DUB00035

Mar 17 2013, 19:02

Цитата(trofim @ Mar 16 2007, 20:30)

Причём голоса рускоговорящих всех DOSовских синтезаторов абсолютно идентичны---будь то speeck ,
SAY.EXE или Demosfen . Я смотрел коды их --- коды похожи очень. Такое ощущение , что у них единый
праПраПраИсходник

или/и в их основе Общая диссертация по синтезу звука . Не подскажите ,
а 1 из вариантов Вашего Sdrv.com случайно не 42636 байт весит ? Дело в том , что у меня такого размера
какой-то Synt, и я собираюсь им заняться

trofim2

Mar 23 2013, 16:48

В свое время дизассемблировал SDRV. и по аналогии написал один к одному (почти) для AVR.
Качество работы меня и моих подопытных вполне устроило. Свободного ресурса навалом. Кому надо забирайте.

DUB00035

Jun 3 2014, 12:45

Цитата(DUB00035 @ Dec 30 2012, 23:36)

Оптимизация Синтезатора Речи
---возможно кого-либо заинтересует:
http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s

Изменена Xlat-таблица : теперь на 42h Порт идут только такие значения --- 00000001b или 00000000b ... Звучит также !

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.