реклама на сайте
подробности

 
 
> Распознавание речи, помогите пожалуйста!
VAHOO
сообщение Aug 28 2007, 19:09
Сообщение #1


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



Я знаю алгоритм для распознавание речи. Слова через микрофон проходит в фильтр, который собран на операционниках, типичные частоты для человеческого голоса находятся на интервале 100 гц - 2 000 гц, по этому используется Фильтр Высокого прохода, полосовой Фильтр и фильтр низкого прохода (аналоговый), после этого сигнал входит в микроконтроллер Т.е. на АЦП (скажем ATmega32) , здесь уже используются цифровые фильтры (Butterworth, Chebishev1,Chebishev2) , уже 'обработанный сигнал' который включает в себе цифры, сравнивается уже заранее хранивший в памяти отпечатков пальца словаря, метод сравнении можно использовать эвклидовые расстояния (сравнение как две векторы) или корреляционный метод, а словарь отпечатки палцов можно получить через MATLAB использовать Быстрое Преобразование Фурье, этот метод работает только для одного человека, То есть метод работает только для человека который говорил слово, если другой человек скажет тот же слово алгоритм не будет распознать. Мне надо такой алгоритм чтобы был универсальным, то если я в памяти микроконтроллера занес отпечатки пальца слова система работал для всех, то есть если все люди говорили тот же слова, система распознавания работал.
И скажите пожалуйста, чем отличаются одно и тот же слово сказанные разными людьми?
Буду рад лубой информации. help.gif


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
3 страниц V  < 1 2 3 >  
Start new topic
Ответов (15 - 29)
VAHOO
сообщение Oct 17 2007, 21:16
Сообщение #16


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



мне надо чтобы ATmega32 распознал 3 армянских слов и все.
У меня сейчас в руках есть PIC контроллер (кварц 10мгц),
он четко распознает русские 3 слова и очень четко работает,
конечно ставлен Lock Bits -и, мне не надо делать интеллектуальный
апарат. Спасибо!


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
Grt
сообщение Oct 19 2007, 14:13
Сообщение #17


Участник
*

Группа: Участник
Сообщений: 62
Регистрация: 3-10-07
Из: Moscow
Пользователь №: 31 035



Цитата(VAHOO @ Oct 18 2007, 01:16) *
мне надо чтобы ATmega32 распознал 3 армянских слов и все.
У меня сейчас в руках есть PIC контроллер (кварц 10мгц),
он четко распознает русские 3 слова и очень четко работает,
конечно ставлен Lock Bits -и, мне не надо делать интеллектуальный
апарат. Спасибо!


Интересно, что это за 3 русских слова ? Распознает для любого человека или как ?
Самый простой способ это сделать ряд полосовых фильтров, настроенных на определенные частоты. Для таких фильтров определяем энергию в каждой полосе и устанавливаем порог срабатывания.
Резонансные частоты и порог срабатывания придется подбирать экспериментально.
Go to the top of the page
 
+Quote Post
VAHOO
сообщение Oct 25 2007, 20:19
Сообщение #18


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



Цитата(Grt @ Oct 19 2007, 17:13) *
Интересно, что это за 3 русских слова ? Распознает для любого человека или как ?
Самый простой способ это сделать ряд полосовых фильтров, настроенных на определенные частоты. Для таких фильтров определяем энергию в каждой полосе и устанавливаем порог срабатывания.
Резонансные частоты и порог срабатывания придется подбирать экспериментально.


да, Распознает для любого человека.


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
Degun
сообщение Oct 26 2007, 05:14
Сообщение #19


Частый гость
**

Группа: Новичок
Сообщений: 84
Регистрация: 4-09-07
Из: Москва
Пользователь №: 30 277



Цитата(VAHOO @ Oct 26 2007, 00:19) *
да, Распознает для любого человека.

А какой принцип, если не секрет?
Go to the top of the page
 
+Quote Post
Grt
сообщение Oct 26 2007, 10:52
Сообщение #20


Участник
*

Группа: Участник
Сообщений: 62
Регистрация: 3-10-07
Из: Moscow
Пользователь №: 31 035



Цитата(VAHOO @ Oct 26 2007, 00:19) *
да, Распознает для любого человека.


И наверное забылм сказать, что порог ложного срабатывания тоже не малый.
Go to the top of the page
 
+Quote Post
VAHOO
сообщение Oct 29 2007, 19:21
Сообщение #21


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



распознает 99%, я не знаю алгоритма,


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
Grt
сообщение Oct 30 2007, 07:07
Сообщение #22


Участник
*

Группа: Участник
Сообщений: 62
Регистрация: 3-10-07
Из: Moscow
Пользователь №: 31 035



Цитата(VAHOO @ Oct 29 2007, 23:21) *
распознает 99%, я не знаю алгоритма,


Как часто он срабатывает на другие слова. Скажем, говоришь ему "му-му", а он тебе выдает это "мама", то понятное дело он всегда будет распознавать
Go to the top of the page
 
+Quote Post
Degun
сообщение Oct 30 2007, 12:15
Сообщение #23


Частый гость
**

Группа: Новичок
Сообщений: 84
Регистрация: 4-09-07
Из: Москва
Пользователь №: 30 277



Цитата(VAHOO @ Aug 28 2007, 22:09) *
... Мне надо такой алгоритм чтобы был универсальным, то если я в памяти микроконтроллера занес отпечатки пальца слова система работал для всех, то есть если все люди говорили тот же слова, система распознавания работал...

Цитата(VAHOO @ Oct 29 2007, 22:21) *
распознает 99%, я не знаю алгоритма,

Так есть или нет у вас алгоритм?
Go to the top of the page
 
+Quote Post
анатолий
сообщение Oct 30 2007, 14:55
Сообщение #24


Местный
***

Группа: Свой
Сообщений: 221
Регистрация: 10-12-05
Из: Украина
Пользователь №: 12 052



Еще в 60-х годах в США выпускался телефон, кот. имел
голосовой набор цифр-
на сотне транзисторов были сделаны фильтры и логика.
Но пользователю надо было очень долго подстраиваться.
Сейчас же лучше как прототип взять алгоритм любого телефонного вокодера -
выход такого кодера - период форманты, форма сигнала возбуждения
(из которой можно узнать кратные форманты ),
звук гласный-согласный -
хорошая информация для дальнейшего распознавания.
Заодно можно ощутить, насколько
это трудная задача.
Go to the top of the page
 
+Quote Post
Grt
сообщение Oct 30 2007, 18:48
Сообщение #25


Участник
*

Группа: Участник
Сообщений: 62
Регистрация: 3-10-07
Из: Moscow
Пользователь №: 31 035



Цитата(анатолий @ Oct 30 2007, 17:55) *
Еще в 60-х годах в США выпускался телефон, кот. имел
голосовой набор цифр-
на сотне транзисторов были сделаны фильтры и логика.
Но пользователю надо было очень долго подстраиваться.
Сейчас же лучше как прототип взять алгоритм любого телефонного вокодера -
выход такого кодера - период форманты, форма сигнала возбуждения
(из которой можно узнать кратные форманты ),
звук гласный-согласный -
хорошая информация для дальнейшего распознавания.
Заодно можно ощутить, насколько
это трудная задача.


На сегодняшний день все коммерчиское ПО в области распознавания и синтеза речи основано на HMMs (скрытые марковские модели). Как правило такое ПО настраивается на проффесиональных базах, например TIGIT - цифры от 0, ..., 9 англиского языка. Порядка 100 спикеров. Есть разметка цифр и т.д.
Соглашусь с тем, что в принципе можно настроить жлезку на несколько слов, причем действительно будет распознавать и процент ложного срабатывания будет зависить от подстройки пороговых величин, выбора резонансных частот и т.д.
Go to the top of the page
 
+Quote Post
VAHOO
сообщение Nov 1 2007, 15:42
Сообщение #26


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



Цитата(Degun @ Oct 30 2007, 15:15) *
Так есть или нет у вас алгоритм?



нет, у меня нет алгоритм, но я тоже очень хочу знать sad.gif


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
Degun
сообщение Nov 1 2007, 17:47
Сообщение #27


Частый гость
**

Группа: Новичок
Сообщений: 84
Регистрация: 4-09-07
Из: Москва
Пользователь №: 30 277



Цитата(VAHOO @ Nov 1 2007, 18:42) *
нет, у меня нет алгоритм, но я тоже очень хочу знать sad.gif

Но, как я понял, у вас есть работающее устройство? Тогда, может быть, проще всего дизассемблировать программу и разобраться как она работает.
Go to the top of the page
 
+Quote Post
VAHOO
сообщение Nov 2 2007, 13:30
Сообщение #28


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



На PIC микроконтроллере ставлен LOCK bit


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
Grt
сообщение Nov 5 2007, 18:39
Сообщение #29


Участник
*

Группа: Участник
Сообщений: 62
Регистрация: 3-10-07
Из: Moscow
Пользователь №: 31 035



Цитата(VAHOO @ Nov 2 2007, 16:30) *
На PIC микроконтроллере ставлен LOCK bit


Объектный код ?
А в чем состоит процесс обучения ? Просто произносите нескослько раз одно и то же слово.
Или процесс обучения отсутствует, и распознаваемые слова фиксированы и прошиты ?
Go to the top of the page
 
+Quote Post
VAHOO
сообщение Nov 12 2007, 19:01
Сообщение #30


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



Цитата(Grt @ Nov 5 2007, 22:39) *
Объектный код ?
А в чем состоит процесс обучения ? Просто произносите нескослько раз одно и то же слово.
Или процесс обучения отсутствует, и распознаваемые слова фиксированы и прошиты ?


процесс обучения отсутствует, и распознаваемые слова фиксированы и прошиты!


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post

3 страниц V  < 1 2 3 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 2nd August 2025 - 11:34
Рейтинг@Mail.ru


Страница сгенерированна за 0.01516 секунд с 7
ELECTRONIX ©2004-2016