|
Распознавание речи, помогите пожалуйста! |
|
|
|
Aug 28 2007, 19:09
|
Частый гость
 
Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834

|
Я знаю алгоритм для распознавание речи. Слова через микрофон проходит в фильтр, который собран на операционниках, типичные частоты для человеческого голоса находятся на интервале 100 гц - 2 000 гц, по этому используется Фильтр Высокого прохода, полосовой Фильтр и фильтр низкого прохода (аналоговый), после этого сигнал входит в микроконтроллер Т.е. на АЦП (скажем ATmega32) , здесь уже используются цифровые фильтры (Butterworth, Chebishev1,Chebishev2) , уже 'обработанный сигнал' который включает в себе цифры, сравнивается уже заранее хранивший в памяти отпечатков пальца словаря, метод сравнении можно использовать эвклидовые расстояния (сравнение как две векторы) или корреляционный метод, а словарь отпечатки палцов можно получить через MATLAB использовать Быстрое Преобразование Фурье, этот метод работает только для одного человека, То есть метод работает только для человека который говорил слово, если другой человек скажет тот же слово алгоритм не будет распознать. Мне надо такой алгоритм чтобы был универсальным, то если я в памяти микроконтроллера занес отпечатки пальца слова система работал для всех, то есть если все люди говорили тот же слова, система распознавания работал. И скажите пожалуйста, чем отличаются одно и тот же слово сказанные разными людьми? Буду рад лубой информации.
--------------------
Прошивка это душа микроконтроллера!
|
|
|
|
|
 |
Ответов
|
Oct 30 2007, 18:48
|
Участник

Группа: Участник
Сообщений: 62
Регистрация: 3-10-07
Из: Moscow
Пользователь №: 31 035

|
Цитата(анатолий @ Oct 30 2007, 17:55)  Еще в 60-х годах в США выпускался телефон, кот. имел голосовой набор цифр- на сотне транзисторов были сделаны фильтры и логика. Но пользователю надо было очень долго подстраиваться. Сейчас же лучше как прототип взять алгоритм любого телефонного вокодера - выход такого кодера - период форманты, форма сигнала возбуждения (из которой можно узнать кратные форманты ), звук гласный-согласный - хорошая информация для дальнейшего распознавания. Заодно можно ощутить, насколько это трудная задача. На сегодняшний день все коммерчиское ПО в области распознавания и синтеза речи основано на HMMs (скрытые марковские модели). Как правило такое ПО настраивается на проффесиональных базах, например TIGIT - цифры от 0, ..., 9 англиского языка. Порядка 100 спикеров. Есть разметка цифр и т.д. Соглашусь с тем, что в принципе можно настроить жлезку на несколько слов, причем действительно будет распознавать и процент ложного срабатывания будет зависить от подстройки пороговых величин, выбора резонансных частот и т.д.
|
|
|
|
Сообщений в этой теме
VAHOO Распознавание речи Aug 28 2007, 19:09 VDG Цитата(VAHOO @ Aug 28 2007, 23:09) Слова ... Aug 28 2007, 20:16 VAHOO Я армянин, у меня образование армянское, по этому ... Aug 29 2007, 06:17 Degun Цитата(VAHOO @ Aug 28 2007, 23:09) ....
И... Sep 6 2007, 06:01 muravei Цитата(Degun @ Sep 6 2007, 10:01) Понимае... Sep 6 2007, 06:20  Degun Цитата(muravei @ Sep 6 2007, 10:20) И даж... Sep 7 2007, 05:38 VDG Цитата(Degun @ Sep 6 2007, 10:01) Понимае... Sep 7 2007, 20:07  Degun Цитата(VDG @ Sep 8 2007, 00:07) Правильно... Oct 8 2007, 09:57   Grt Цитата(Degun @ Oct 8 2007, 13:57) Потреби... Oct 8 2007, 20:03    Degun Цитата(Grt @ Oct 9 2007, 00:03) Если речь... Oct 9 2007, 06:21     Grt Цитата(Degun @ Oct 9 2007, 10:21) Не всяк... Oct 9 2007, 07:25      Degun Цитата(Grt @ Oct 9 2007, 11:25) Это уже в... Oct 10 2007, 12:59       Grt Цитата(Degun @ Oct 10 2007, 16:59) Это по... Oct 10 2007, 13:06 bambr А Атмега потянет для такой задачи? Или вы все таки... Sep 6 2007, 06:43 Doka to VAHOO
посмотрите ссылки в этой теме Sep 8 2007, 15:31 VAHOO мне надо чтобы ATmega32 распознал 3 армянских слов... Oct 17 2007, 21:16 Grt Цитата(VAHOO @ Oct 18 2007, 01:16) мне на... Oct 19 2007, 14:13  VAHOO Цитата(Grt @ Oct 19 2007, 17:13) Интересн... Oct 25 2007, 20:19   Degun Цитата(VAHOO @ Oct 26 2007, 00:19) да, Ра... Oct 26 2007, 05:14   Grt Цитата(VAHOO @ Oct 26 2007, 00:19) да, Ра... Oct 26 2007, 10:52 VAHOO распознает 99%, я не знаю алгоритма, Oct 29 2007, 19:21 Grt Цитата(VAHOO @ Oct 29 2007, 23:21) распоз... Oct 30 2007, 07:07 Degun Цитата(VAHOO @ Aug 28 2007, 22:09) ... Мн... Oct 30 2007, 12:15 VAHOO Цитата(Degun @ Oct 30 2007, 15:15) Так ес... Nov 1 2007, 15:42  Degun Цитата(VAHOO @ Nov 1 2007, 18:42) нет, у ... Nov 1 2007, 17:47 VAHOO На PIC микроконтроллере ставлен LOCK bit Nov 2 2007, 13:30 Grt Цитата(VAHOO @ Nov 2 2007, 16:30) На PIC ... Nov 5 2007, 18:39  VAHOO Цитата(Grt @ Nov 5 2007, 22:39) Объектный... Nov 12 2007, 19:01 Cont "Если речь идет о распознавании речи, то на с... Apr 12 2008, 10:04 Grt Цитата(Cont @ Apr 12 2008, 14:04) "Е... Apr 17 2008, 08:26 Cont Да мне новая и не нужна. Мне нужны основы, вся мат... Apr 17 2008, 10:48 VAHOO а кто знает самый прастой алгоритм для распознаван... Jun 29 2008, 19:17 DRUID3 Цитата(VAHOO @ Jun 29 2008, 22:17) а кто ... Jun 30 2008, 03:17  VAHOO Цитата(DRUID3 @ Jun 30 2008, 07:17) срав... Nov 21 2008, 10:04 Grt Цитата(VAHOO @ Jun 29 2008, 23:17) а кто ... Jun 30 2008, 12:03 VDG Если считаете что за год (от открытия темы) что-то... Jun 29 2008, 20:38 muravei Что-то типа "нечеткой логики" Nov 21 2008, 13:00 VAHOO Цитата(muravei @ Nov 21 2008, 17:00) Что-... Nov 23 2008, 20:04  muravei Цитата(VAHOO @ Nov 23 2008, 23:04) а немн... Nov 24 2008, 18:44   VAHOO Цитата(muravei @ Nov 24 2008, 22:44) Нет... Nov 25 2008, 05:19
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|