|
Распознавание речи, помогите пожалуйста! |
|
|
|
Aug 29 2007, 05:21
|
Частый гость
 
Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834

|
Я знаю алгоритм для распознавание речи. Слова через микрофон проходит в фильтр, который собран на операционниках, типичные частоты для человеческого голоса находятся на интервале 100 гц - 2 000 гц, по этому используется Фильтр Высокого прохода, полосовой Фильтр и фильтр низкого прохода (аналоговый), после этого сигнал входит в микроконтроллер Т.е. на АЦП (скажем ATmega32) , здесь уже используются цифровые фильтры (Butterworth, Chebishev1,Chebishev2) , уже 'обработанный сигнал' который включает в себе цифры, сравнивается уже заранее хранивший в памяти отпечатков пальца словаря, метод сравнении можно использовать эвклидовые расстояния (сравнение как две векторы) или корреляционный метод, а словарь отпечатки палцов можно получить через MATLAB использовать Быстрое Преобразование Фурье, этот метод работает только для одного человека, То есть метод работает только для человека который говорил слово, если другой человек скажет тот же слово алгоритм не будет распознать. Мне надо такой алгоритм чтобы был универсальным, то если я в памяти микроконтроллера занес отпечатки пальца слова система работал для всех, то есть если все люди говорили тот же слова, система распознавания работал. И скажите пожалуйста, чем отличаются одно и тот же слово сказанные разными людьми? Буду рад лубой информации.
--------------------
Прошивка это душа микроконтроллера!
|
|
|
|
|
Aug 29 2007, 05:36
|
Группа: Новичок
Сообщений: 5
Регистрация: 4-08-07
Пользователь №: 29 562

|
Цитата(VAHOO @ Aug 29 2007, 09:21)  скажите пожалуйста, чем отличаются одно и тот же слово сказанные разными людьми? Буду рад лубой информации. Слово отличается частотными характеристиками, например один человек произнесёт букву "А" это будет соответствовать частоте 700 Гц, человек с более писклявым голосом скажет тоже - получим частоту 1000 Гц.
|
|
|
|
|
Aug 29 2007, 07:22
|
Местный
  
Группа: Участник
Сообщений: 270
Регистрация: 29-06-06
Пользователь №: 18 445

|
Цитата(Maik-vs @ Aug 29 2007, 11:03)  А как распознать Ваш текст? Не стоит так строго. Думается, автор не русскоязычен просто.
|
|
|
|
|
Aug 29 2007, 07:29
|

Гуру
     
Группа: Свой
Сообщений: 2 538
Регистрация: 13-08-05
Пользователь №: 7 591

|
Цитата(Maik-vs @ Aug 29 2007, 11:03)  И перлы грамматики типа "если другой человек скажет тот же слово алгоритм не будет распознать." Вы хотите получить готовое по теме, которой наука занимается с 30-х годов (представьте себе! И до Вас кто-то что-то делал!) , и не удосужились хотя бы согласовать предложения. Ну чего Вы напали на человека, "перлы", я думаю, не его , а компового переводчика. 2VAHOO А задача разпознования речи не для АВР, с фильтрами , или без. Почитайте тут . может чуть прояснится. Цитата(Kuzmi4 @ Aug 29 2007, 11:25)  частотные характеристики голоса разных людей разные... Это называется частота ОСНОВНОГО ТОНА
|
|
|
|
|
Aug 29 2007, 07:42
|
Группа: Новичок
Сообщений: 5
Регистрация: 4-08-07
Пользователь №: 29 562

|
Цитата(muravei @ Aug 29 2007, 11:29)  Это называется частота ОСНОВНОГО ТОНА Спасибо
|
|
|
|
|
Aug 29 2007, 07:48
|
Местный
  
Группа: Участник
Сообщений: 246
Регистрация: 4-12-06
Пользователь №: 23 101

|
Цитата(Kuzmi4 @ Aug 29 2007, 11:25)  2 Maik-vs - вместо того чтоб раскидываться руками, дали бы конкретный отвает ПО ТЕМЕ...
А вообсче когда то сталкивался с похожим - но далее интереса не пошло - тобто чисто ознакомления с литературой - там основная проблема как раз что описует Borshef - частотные характеристики голоса разных людей разные...Хотя если есть сходу готовое решение (как описывает уважаемый Maik-vs) - то было бы неплохо увидеть.. Дома покопаюсь у себя - если найду - выложу что есть..
А вообсче то авр-ки не для таких задач - тут ТМС надо использовать или что-то схожее... Да, не сдержался. Полнолуние, наверное.  Поймите, надоело читать типа "Хачю сделать робата шоб хадил на нагах и были глаза шоб видить. У каго есть прошива, где скачевать?" Как будто науки нету, один начинающий ембеддер в пещере нарисовался. Готового решения, сходу - нет! Вот я сейчас клаву топчу, а не диктую, а Вы? Примерное решение - кластеризация изменения частоты и амплидуты в пространстве времени слова. До этого - задача выделения отдельных слов из слитной речи. Задача выделения персонального словаря. Контекстная интерпретация команды. Ну и по ходу набежит...
|
|
|
|
|
Aug 29 2007, 09:45
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Когда-то, как и все наверное, очень интересовался данной темой. Читал книжку с картинками (осциллограммами и спектрограммами).  По сути - исследование в данной области. Так вот одним спектральным анализом не обойдёшься. (Хотя я бы и за это не взялся бы) Одна и таже буква, произнесённая одним и тем же человеком, но стоящая в разном окружении имеет совершенно разный спектр частот. Поэтому вводятся и распознаются фонемы. Или даже целиком слова. Далее, что очевидно, выполняется работа сопоставимая с переводчиками которые вы ругали. То есть чтобы распознать текст его надо ПОНЯТЬ. Вот в этом то и возникает загвоздка в настоящий момент По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокд рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все солво цликеом
|
|
|
|
|
Aug 29 2007, 09:48
|
Частый гость
 
Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834

|
Я армянин, у меня образование армянское, по этому извиняюсь sorry!
--------------------
Прошивка это душа микроконтроллера!
|
|
|
|
|
Aug 29 2007, 09:56
|
Участник

Группа: Участник
Сообщений: 25
Регистрация: 25-08-05
Пользователь №: 7 966

|
Так это уже вопрос искуственного интиллекта, как и распознавание голосовых комманд на естественном языке, а не на слелизированном языке из определенного количества слов четко описанных в инструкции по эксплуатации (предстате инструкцию к прибору из 500 слов, ее еще надо выучить как новый иностранный язык)
|
|
|
|
|
Aug 29 2007, 10:02
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Цитата(VAHOO @ Aug 29 2007, 12:48)  Я армянин, у меня образование армянское, по этому извиняюсь sorry! Да не обращайте внимание на такие выпады. У вас неплохой русский, учитывая что Вы им не являетесь. Мне, к примеру, наоборот приятно что интерес к МК так сближает разных людей и разные национальности. Здесь, в отличие от телесистем, совершенно нет межнациональной грызни. За это большая благодарность модераторам. Я очень надеюсь что и в дальнейшем её не будет. Вам же всё таки рекомендую взяться пока за более простую тему.
|
|
|
|
|
Aug 29 2007, 14:10
|
Частый гость
 
Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834

|
Спасибо SasaVitebsk мне надо чтобы ATmega32 распознал 3 армянских слов и все. У меня сейчас в руках есть PIC контроллер (кварц 10мгц), он четко распознает русские 3 слова и очень четко работает, конечно ставлен Lock Bits -и, мне не надо делать интеллектуальный апарат. Спасибо!
--------------------
Прошивка это душа микроконтроллера!
|
|
|
|
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|