реклама на сайте
подробности

 
 
2 страниц V   1 2 >  
Reply to this topicStart new topic
> Распознавание речи, помогите пожалуйста!
VAHOO
сообщение Aug 29 2007, 05:21
Сообщение #1


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



Я знаю алгоритм для распознавание речи. Слова через микрофон проходит в фильтр, который собран на операционниках, типичные частоты для человеческого голоса находятся на интервале 100 гц - 2 000 гц, по этому используется Фильтр Высокого прохода, полосовой Фильтр и фильтр низкого прохода (аналоговый), после этого сигнал входит в микроконтроллер Т.е. на АЦП (скажем ATmega32) , здесь уже используются цифровые фильтры (Butterworth, Chebishev1,Chebishev2) , уже 'обработанный сигнал' который включает в себе цифры, сравнивается уже заранее хранивший в памяти отпечатков пальца словаря, метод сравнении можно использовать эвклидовые расстояния (сравнение как две векторы) или корреляционный метод, а словарь отпечатки палцов можно получить через MATLAB использовать Быстрое Преобразование Фурье, этот метод работает только для одного человека, То есть метод работает только для человека который говорил слово, если другой человек скажет тот же слово алгоритм не будет распознать. Мне надо такой алгоритм чтобы был универсальным, то если я в памяти микроконтроллера занес отпечатки пальца слова система работал для всех, то есть если все люди говорили тот же слова, система распознавания работал.
И скажите пожалуйста, чем отличаются одно и тот же слово сказанные разными людьми?
Буду рад лубой информации.


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
Borshef
сообщение Aug 29 2007, 05:36
Сообщение #2





Группа: Новичок
Сообщений: 5
Регистрация: 4-08-07
Пользователь №: 29 562



Цитата(VAHOO @ Aug 29 2007, 09:21) *
скажите пожалуйста, чем отличаются одно и тот же слово сказанные разными людьми?
Буду рад лубой информации.


Слово отличается частотными характеристиками, например один человек произнесёт букву "А" это будет соответствовать частоте 700 Гц, человек с более писклявым голосом скажет тоже - получим частоту 1000 Гц.
Go to the top of the page
 
+Quote Post
Maik-vs
сообщение Aug 29 2007, 07:03
Сообщение #3


Местный
***

Группа: Участник
Сообщений: 246
Регистрация: 4-12-06
Пользователь №: 23 101



Дорогой аффтар! Вот Вы интересуетесь алгоритмом распознавания речи. А как распознать Ваш текст? Кто такой фильтр высокого прохода? Знаете ли Вы, что Chebishev - это фамилия русского учёного Чебышева? Каким боком тут пальцы и их отпечатки? И перлы грамматики типа "если другой человек скажет тот же слово алгоритм не будет распознать." Вы хотите получить готовое по теме, которой наука занимается с 30-х годов (представьте себе! И до Вас кто-то что-то делал!) , и не удосужились хотя бы согласовать предложения. Не охота отвечать по сути. Читайте книги. Ваша задача была решена в сталинских шарашках.
Go to the top of the page
 
+Quote Post
pokos
сообщение Aug 29 2007, 07:22
Сообщение #4


Местный
***

Группа: Участник
Сообщений: 270
Регистрация: 29-06-06
Пользователь №: 18 445



Цитата(Maik-vs @ Aug 29 2007, 11:03) *
А как распознать Ваш текст?

Не стоит так строго. Думается, автор не русскоязычен просто.
Go to the top of the page
 
+Quote Post
Kuzmi4
сообщение Aug 29 2007, 07:25
Сообщение #5


Гуру
******

Группа: Свой
Сообщений: 3 304
Регистрация: 13-02-07
Из: 55°55′5″ 37°52′16″
Пользователь №: 25 329



2 Maik-vs - вместо того чтоб раскидываться руками, дали бы конкретный отвает ПО ТЕМЕ...

А вообсче когда то сталкивался с похожим - но далее интереса не пошло - тобто чисто ознакомления с литературой - там основная проблема как раз что описует Borshef - частотные характеристики голоса разных людей разные...Хотя если есть сходу готовое решение (как описывает уважаемый Maik-vs) - то было бы неплохо увидеть.. Дома покопаюсь у себя - если найду - выложу что есть..

А вообсче то авр-ки не для таких задач - тут ТМС надо использовать или что-то схожее...
Go to the top of the page
 
+Quote Post
muravei
сообщение Aug 29 2007, 07:29
Сообщение #6


Гуру
******

Группа: Свой
Сообщений: 2 538
Регистрация: 13-08-05
Пользователь №: 7 591



Цитата(Maik-vs @ Aug 29 2007, 11:03) *
И перлы грамматики типа "если другой человек скажет тот же слово алгоритм не будет распознать." Вы хотите получить готовое по теме, которой наука занимается с 30-х годов (представьте себе! И до Вас кто-то что-то делал!) , и не удосужились хотя бы согласовать предложения.

Ну чего Вы напали на человека, "перлы", я думаю, не его , а компового переводчика.
2VAHOO
А задача разпознования речи не для АВР, с фильтрами , или без.
Почитайте
тут . может чуть прояснится.

Цитата(Kuzmi4 @ Aug 29 2007, 11:25) *
частотные характеристики голоса разных людей разные...

Это называется частота ОСНОВНОГО ТОНА
Go to the top of the page
 
+Quote Post
Borshef
сообщение Aug 29 2007, 07:42
Сообщение #7





Группа: Новичок
Сообщений: 5
Регистрация: 4-08-07
Пользователь №: 29 562



Цитата(muravei @ Aug 29 2007, 11:29) *
Это называется частота ОСНОВНОГО ТОНА

Спасибо smile.gif
Go to the top of the page
 
+Quote Post
Maik-vs
сообщение Aug 29 2007, 07:48
Сообщение #8


Местный
***

Группа: Участник
Сообщений: 246
Регистрация: 4-12-06
Пользователь №: 23 101



Цитата(Kuzmi4 @ Aug 29 2007, 11:25) *
2 Maik-vs - вместо того чтоб раскидываться руками, дали бы конкретный отвает ПО ТЕМЕ...

А вообсче когда то сталкивался с похожим - но далее интереса не пошло - тобто чисто ознакомления с литературой - там основная проблема как раз что описует Borshef - частотные характеристики голоса разных людей разные...Хотя если есть сходу готовое решение (как описывает уважаемый Maik-vs) - то было бы неплохо увидеть.. Дома покопаюсь у себя - если найду - выложу что есть..

А вообсче то авр-ки не для таких задач - тут ТМС надо использовать или что-то схожее...

Да, не сдержался. Полнолуние, наверное. smile.gif Поймите, надоело читать типа "Хачю сделать робата шоб хадил на нагах и были глаза шоб видить. У каго есть прошива, где скачевать?" Как будто науки нету, один начинающий ембеддер в пещере нарисовался.
Готового решения, сходу - нет! Вот я сейчас клаву топчу, а не диктую, а Вы? Примерное решение - кластеризация изменения частоты и амплидуты в пространстве времени слова. До этого - задача выделения отдельных слов из слитной речи. Задача выделения персонального словаря. Контекстная интерпретация команды. Ну и по ходу набежит...
Go to the top of the page
 
+Quote Post
Kuzmi4
сообщение Aug 29 2007, 09:31
Сообщение #9


Гуру
******

Группа: Свой
Сообщений: 3 304
Регистрация: 13-02-07
Из: 55°55′5″ 37°52′16″
Пользователь №: 25 329



2 Maik-vs - smile.gif laughing.gif

На счёт ХАЧЮ - согласен....Литература есть - мона почитать - на счёт распознавания речи - тут muravei дал очень полезную ссылку, так что думаю товарищу есть куда копать...По крайней мере на ближайшие пару недель...Хотя я в принципе встречал - на АВР товарищи делали распознавалку для 3 слов - 100% гарантия (ну приблизительно 100 - кол-во экспериментов то ограничено..). Вот на выходных покопаюсь - выложу товарищу - идея там простая как собсно и реализация. НУ а для полноценного распознавания - я думаю товарищу не в форуме АВР надо было задавать такие вопросы - в сторону армов копать надо...
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Aug 29 2007, 09:45
Сообщение #10


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Когда-то, как и все наверное, очень интересовался данной темой. Читал книжку с картинками (осциллограммами и спектрограммами). smile.gif По сути - исследование в данной области.

Так вот одним спектральным анализом не обойдёшься. (Хотя я бы и за это не взялся бы) Одна и таже буква, произнесённая одним и тем же человеком, но стоящая в разном окружении имеет совершенно разный спектр частот. Поэтому вводятся и распознаются фонемы. Или даже целиком слова. Далее, что очевидно, выполняется работа сопоставимая с переводчиками которые вы ругали. То есть чтобы распознать текст его надо ПОНЯТЬ. Вот в этом то и возникает загвоздка в настоящий момент

По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокд рсапожолены бкувы в солве.
Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано
ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все солво цликеом
Go to the top of the page
 
+Quote Post
VAHOO
сообщение Aug 29 2007, 09:48
Сообщение #11


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



Я армянин, у меня образование армянское, по этому извиняюсь smile.gif
sorry!


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
nick-l
сообщение Aug 29 2007, 09:56
Сообщение #12


Участник
*

Группа: Участник
Сообщений: 25
Регистрация: 25-08-05
Пользователь №: 7 966



Так это уже вопрос искуственного интиллекта, как и распознавание голосовых комманд на естественном языке, а не на слелизированном языке из определенного количества слов четко описанных в инструкции по эксплуатации (предстате инструкцию к прибору из 500 слов, ее еще надо выучить как новый иностранный язык)
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Aug 29 2007, 10:02
Сообщение #13


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Цитата(VAHOO @ Aug 29 2007, 12:48) *
Я армянин, у меня образование армянское, по этому извиняюсь smile.gif
sorry!

Да не обращайте внимание на такие выпады. У вас неплохой русский, учитывая что Вы им не являетесь. Мне, к примеру, наоборот приятно что интерес к МК так сближает разных людей и разные национальности. Здесь, в отличие от телесистем, совершенно нет межнациональной грызни. За это большая благодарность модераторам. Я очень надеюсь что и в дальнейшем её не будет.
Вам же всё таки рекомендую взяться пока за более простую тему.
Go to the top of the page
 
+Quote Post
VAHOO
сообщение Aug 29 2007, 14:10
Сообщение #14


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



Спасибо SasaVitebsk smile.gif
мне надо чтобы ATmega32 распознал 3 армянских слов и все.
У меня сейчас в руках есть PIC контроллер (кварц 10мгц),
он четко распознает русские 3 слова и очень четко работает,
конечно ставлен Lock Bits -и, мне не надо делать интеллектуальный
апарат. Спасибо!


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
Kuzmi4
сообщение Aug 29 2007, 14:30
Сообщение #15


Гуру
******

Группа: Свой
Сообщений: 3 304
Регистрация: 13-02-07
Из: 55°55′5″ 37°52′16″
Пользователь №: 25 329



2 VAHOO - на счёт армянских не знаю - но на счёт английских - в том простеньком примере чт оя смотрел - реализовано именно оно - при чём по моему как раз на 32-й меге...В обсчем как доберусь к инфе - так выложу....
Go to the top of the page
 
+Quote Post

2 страниц V   1 2 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 15th July 2025 - 05:49
Рейтинг@Mail.ru


Страница сгенерированна за 0.01481 секунд с 7
ELECTRONIX ©2004-2016