реклама на сайте
подробности

 
 
> Синтезатор речи
VAHOO
сообщение Mar 8 2007, 23:56
Сообщение #1


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



как можно сделать синтезатор речи скажем на AVR?

буду рад лубой информации


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
5 страниц V  « < 2 3 4 5 >  
Start new topic
Ответов (45 - 59)
trofim
сообщение Mar 16 2007, 16:30
Сообщение #46





Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039



Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го.
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Mar 17 2007, 00:25
Сообщение #47


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Цитата(CD_Eater @ Mar 16 2007, 15:01) *
Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук!

Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции).


Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. biggrin.gif

Я считаю, что даже распознавание
Цитата
фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки)
сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся.
Go to the top of the page
 
+Quote Post
Doka
сообщение Mar 17 2007, 13:24
Сообщение #48


Electrical Engineer
******

Группа: СуперМодераторы
Сообщений: 2 163
Регистрация: 4-10-04
Пользователь №: 778



Цитата(SasaVitebsk @ Mar 17 2007, 00:25) *
Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. :biggrin:

изначально говорилось об этом:
Цитата(VAHOO @ Mar 9 2007, 23:11) *
мне надо, просто, что бы если я что то сказал,
микроконтроллер понял и что то сделал
, или ответил,
ответит можно через SD CARD или скажем ISD2560,
но как распознавать речь?





Цитата(SasaVitebsk @ Mar 17 2007, 00:25) *
Я считаю, что даже распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся.

ссылка уже приводилась в этом топике:
http://instruct1.cit.cornell.edu/courses/e...ndex.html#intro
сделано именно на AVR . В таблицах 2-5 приведены вероятности правильного распознавания (результаты эксперимента).
Исходники брать там же.
И вводите в заблуждение людей..


--------------------
Блог iDoka.ru
CV linkedin.com/in/iDoka
Sources github.com/iDoka


Never stop thinking...........................
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Mar 17 2007, 22:16
Сообщение #49


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



smile.gif Значит это я ввожу в заблуждение людей.
И приведенный проект тому подтверждение.
smile.gif smile.gif smile.gif

Когда на голову человека падает кирпич, то
один скажет: боже, почему всё это падает на меня, - вот не везёт
второй скажет: вот это повезло - другого бы убило
Вы похоже скажете: блин чуть не попало.

По-моему приведенный пример - ярчайшее подтверждение моих слов. Это ещё один пример, как потратив год работы можно лажануться. Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются.

Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM". smile.gif Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. Хотя я бы не дал.

Извините, но оттуда копировать просто НЕЧЕГО.
Go to the top of the page
 
+Quote Post
Doka
сообщение Mar 18 2007, 22:34
Сообщение #50


Electrical Engineer
******

Группа: СуперМодераторы
Сообщений: 2 163
Регистрация: 4-10-04
Пользователь №: 778



Цитата(SasaVitebsk @ Mar 17 2007, 22:16) *
Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются.
links, rechts (по произношению различаются не сильнее чем left/right)
а вы предлагаете в качестве команд использовать слова вроде: "демобилизация", "идиосинкразия" ? кхм..

Цитата(SasaVitebsk @ Mar 17 2007, 22:16) *
Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM". smile.gif Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта.
в качестве промежуточного результата могли и не такую вероятность получить.. при использовании обучения (см.далее в оригинальной статье) на словаре из 8ми слов получили минимальную вероятность распознавания в 85% (и то только на одном слове - более половины слов определяются с вероятностью в 100%).
насчет цены - странно, вы к этому придрались.. это дипломный приект и в качестве справки просто приведена стоимость ВОМ.
тут помоему должно быть всё ясно: железо отдельно - исследовательская работа отдельно.

Цитата(SasaVitebsk @ Mar 17 2007, 22:16) *
Извините, но оттуда копировать просто НЕЧЕГО.
забыли добавить - "ИМХО".
авторы использовали простейший подход - выделение полос фильтрами, однако приводят иные методы - улучшающие точность.


да, и главное: как раз такие проекты (и тут скорее не как "проекты-для-копирования" а как "проекты-прецеденты")
"когда (хоть и не 1) человек сделал на AVR и добился определенных результатов" и помогают снять ограничивающие убеждения, не позволяющие не только прочувствовать возможность реализации "в прнципе", но и мещающие инженеру быть эффективным (ставить творческие задачи, здраво оценивать трудоемкость, анализировать существующие разработки, штудировать (если придется) стопки литературы)


--------------------
Блог iDoka.ru
CV linkedin.com/in/iDoka
Sources github.com/iDoka


Never stop thinking...........................
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Mar 18 2007, 23:06
Сообщение #51


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Не буду с вами спорить. У нас просто разные взгляды на вещи. Например человеку, который порядочный на 85% после обучения, - я бы деньги не отдал. Но собственно не о том разговор.

Этот проект всё равно не подойдёт для начинающего. (А разбирающийся за него сам не возьмётся) Причина проста. Даже перевести его на русский словарь (насколько я понял при беглом просмотре) - это уже не совсем простая операция требующая определённых знаний отнюдь не в программировании.

И ещё повторюсь. На вопрос "можно ли?" - отвечу "да" На вопрос "целесообразно ли?" - отвечу "нет". Причина - надо длительные и трудоёмкие исследования.
Go to the top of the page
 
+Quote Post
CD_Eater
сообщение Mar 18 2007, 23:44
Сообщение #52


Частый гость
**

Группа: Новичок
Сообщений: 173
Регистрация: 3-09-04
Из: Moscow
Пользователь №: 595



85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью

Да и люди, порядочные более чем на 85% в наше время - большая редкость. wink.gif
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Mar 19 2007, 15:29
Сообщение #53


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Цитата(CD_Eater @ Mar 19 2007, 00:44) *
85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью

Да и люди, порядочные более чем на 85% в наше время - большая редкость. wink.gif


По первому - то сотовый телефон, а то секьюрити. smile.gif

По второму - Вас видимо кто-то обидел. smile.gif Забавно когда ко мне менты приходят, а я их куда-нибудь пытаюсь перенаправить. Типовая фраза такая:
- Саша тебе доверяю, а другим нет.
- Почему?
- Так кругом же бандиты!!! blink.gif

biggrin.gif
Не знаю вокруг меня "отличные люди". biggrin.gif


Всё таки порядочный человек на 85% - это уже непорядочный. К тому же после обучения. biggrin.gif
Go to the top of the page
 
+Quote Post
DUB00035
сообщение Dec 30 2012, 15:26
Сообщение #54





Группа: Новичок
Сообщений: 6
Регистрация: 30-12-12
Пользователь №: 75 024



Оптимизация Синтезатора Речи
---возможно кого-либо заинтересует:
http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s
Go to the top of the page
 
+Quote Post
alexf
сообщение Jan 1 2013, 01:56
Сообщение #55


Местный
***

Группа: Свой
Сообщений: 420
Регистрация: 22-12-04
Пользователь №: 1 608



Цитата(CD_Eater @ Mar 18 2007, 15:44) *
85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью


Видимо сил-но зависит от системы. Голосовым набором я пользую только за рулем и там участвует встроенный BT, но цифры распознаются на 100%. Естественно все работает не на AVR sm.gif

Что касается произвольного текста, то даже лучшие программы типа Dragon Dictate на много-гигагерцовых PC и полном словаре под рукой далеки от 100%.
Go to the top of the page
 
+Quote Post
perfect
сообщение Jan 1 2013, 08:17
Сообщение #56


Знающий
****

Группа: Участник
Сообщений: 565
Регистрация: 13-03-10
Пользователь №: 55 932



Вообще не в теме, но думаю что если распознающий не понимает говорящего, то говорящему нужно снизойти до распознающего.
Простейший расппознающий, я думаю, где-то на двоичном уровне, что-то вроде морзянки, RC5 протокола для телевизоров или DiSEqC sm.gif
Ну, ничё не поделааешь, говорящему придётся издавать пачки звуков-пауз из очень ограниченного лексикона. rolleyes.gif
Go to the top of the page
 
+Quote Post
ARV
сообщение Jan 1 2013, 09:03
Сообщение #57


Профессионал
*****

Группа: Свой
Сообщений: 1 143
Регистрация: 30-09-08
Из: Новочеркасск
Пользователь №: 40 581



а в андроиде встроено распознавание - в моих попытках все мои слова, сказанные спокойно по одному слову, распознаются на 100%. насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы, но факт говорит сам за себя - отдельные слова распознаются отлично и безошибочно.

что касается распознавания на AVR, то с определенными ограничениями мне эта задача представляется решаемой, т.к. были прецеденты на PIC, а PIC не далеко от AVR ушел, и даже скорее отстает в плане производительности: http://www.530.ru/electronics/projects.php?do=p124


--------------------
Я бы взял частями... но мне надо сразу.
Go to the top of the page
 
+Quote Post
perfect
сообщение Jan 1 2013, 09:21
Сообщение #58


Знающий
****

Группа: Участник
Сообщений: 565
Регистрация: 13-03-10
Пользователь №: 55 932



Цитата(ARV @ Jan 1 2013, 13:03) *
насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы

Колоссальные ресурсы можно представить и как колоссальные людские ресурсы biggrin.gif
Go to the top of the page
 
+Quote Post
LexaK
сообщение Jan 10 2013, 06:41
Сообщение #59


Частый гость
**

Группа: Свой
Сообщений: 118
Регистрация: 3-12-06
Из: Новороссийск
Пользователь №: 23 082



Все придумано до нас. Чипы RSC-4128 фирмы Sensory.
Подробно тут
Go to the top of the page
 
+Quote Post
hd44780
сообщение Jan 10 2013, 11:48
Сообщение #60


Профессионал
*****

Группа: Свой
Сообщений: 1 202
Регистрация: 26-08-05
Из: Донецк, ДНР
Пользователь №: 7 980



Цитата(ARV @ Jan 1 2013, 11:03) *
я понял, это все делается через интернет

Скорее всего.
Вот тут - http://habrahabr.ru/post/146501/ делают через гугль и Wi-Fi (то бишь, интернет). Это, конечно, далеко не AVR, но, если надо, то и STM32 не жалко biggrin.gif .


--------------------
Чтобы возить такого пассажира, необходим лимузин другого класса.
(с) Мария Эдуарда
Go to the top of the page
 
+Quote Post

5 страниц V  « < 2 3 4 5 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 19th July 2025 - 09:31
Рейтинг@Mail.ru


Страница сгенерированна за 0.01492 секунд с 7
ELECTRONIX ©2004-2016