Синтезатор речи - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Wiki

Photo

Forum

Forum

Reviews

Reviews

Help (!)

Help (!)

Правила Форума

Пользователи

Календарь

Личная почта

Панель управления

Форум разработчиков электроники ELECTRONIX.ru > Микроконтроллеры (MCs) > AVR

5 страниц

1 2 3 > »

Reply to this topic

Start new topic

Синтезатор речи

VAHOO Просмотр профиля	Mar 8 2007, 23:56 Сообщение #1
Частый гость Группа: Участник Сообщений: 163 Регистрация: 22-09-05 Пользователь №: 8 834	как можно сделать синтезатор речи скажем на AVR? буду рад лубой информации -------------------- Прошивка это душа микроконтроллера!

beer_warrior Просмотр профиля	Mar 9 2007, 00:45 Сообщение #2
Профессионал Группа: Свой Сообщений: 1 065 Регистрация: 8-10-05 Из: Kiev, UA Пользователь №: 9 380	Цитата как можно сделать синтезатор речи скажем на AVR? Воспроизводить звуки с достаточно высоким качеством AVR в состоянии. Взять хотя бы аппликэйшн цифровым диктофоном http://atmel.com/dyn/resources/prod_documents/doc1456.pdf остальное дело техники - использовать алгоритмы синтеза речи из готовых сэмплов. -------------------- Вони шукають те, чого нема, Щоб довести, що його не існує.

VDG Просмотр профиля	Mar 9 2007, 16:24 Сообщение #3
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	Цитата(VAHOO @ Mar 8 2007, 23:56) как можно сделать синтезатор речи скажем на AVR? буду рад лубой информации ИМХО правильнее вначале найти исходный проект какого-нибудь синтезатора речи для компьютера. И если качество понравится, то перенести на AVR. PS. Склейка из отдельных "букв" или даже фонем без специальной обработки даёт отвратное качество. А дополнительную обработку AVR не потянет. -------------------- студия разработки электроники

VAHOO Просмотр профиля	Mar 9 2007, 23:11 Сообщение #4
Частый гость Группа: Участник Сообщений: 163 Регистрация: 22-09-05 Пользователь №: 8 834	мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответит можно через SD CARD или скажем ISD2560, но как распознавать реч? -------------------- Прошивка это душа микроконтроллера!

vvvvv Просмотр профиля	Mar 9 2007, 23:32 Сообщение #5
Местный Группа: Свой Сообщений: 342 Регистрация: 21-06-04 Пользователь №: 85	Если очень хочется, можно попытаться записать 20 вариантов одного и того же слова, пропущенного через НЧ фильтр, с верхней частотой 3400. И на AVR сравнивать произнесенное слово с архивом. При совпадении выполнить команду. Набрать удачные варианты можно при помощи отдельной программки. Но вообще геморрой еще тот. Вряд ли удастся надежную распознавалку создать. Тут блин целые диссеры пишутся с применением нейросетей в алгоритмах распознавания речи. И на самом деле это задачка для мощного DSP, а не для AVR.

VDG Просмотр профиля	Mar 10 2007, 00:09 Сообщение #6
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	Цитата(VAHOO @ Mar 9 2007, 23:11) мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, А не задумывались почему вы сейчас это набили на клавиатуре, а не произнесли в микрофон? Это даже на компьютере нереально, не то что на контроллере. Лет через н-дцать возможно... на компе.

acex2 Просмотр профиля	Mar 10 2007, 00:22 Сообщение #7
Адепт Группа: Свой Сообщений: 520 Регистрация: 15-02-05 Пользователь №: 2 656	Цитата(VAHOO @ Mar 9 2007, 23:11) мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответит можно через SD CARD или скажем ISD2560, но как распознавать реч? Вы бы определились - вам синтез или распознавание нужно? На АВРке нормальное распознавание не сделаешь, а вот при помощи процессоров от http://www.sensoryinc.com/ при условии ограниченного набора слов это вполне реально.

SasaVitebsk Просмотр профиля	Mar 10 2007, 00:57 Сообщение #8
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Цитата(acex2 @ Mar 10 2007, 01:22) Вы бы определились - вам синтез или распознавание нужно? На АВРке нормальное распознавание не сделаешь, а вот при помощи процессоров от http://www.sensoryinc.com/ при условии ограниченного набора слов это вполне реально. Реально для кого? Для вас или для вопрошающего? По-моему надо ясно человеку сказать. Хорошему коллективу имеющему приличные знания в разных областях потребуется пару лет для продукта более-менее пригодного к использованию.

=GM= Просмотр профиля	Mar 10 2007, 02:29 Сообщение #9
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Народ, в пылу дискуссии не прибейте человека ненароком(:-). Его позиция совершенно ясная: он сказал, я спрошу контроллер, а он ответит, словом ли, делом ли. Цитата(VAHOO @ Mar 9 2007, 20:11) мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответить можно через SD CARD или скажем ISD2560, но как распознавать речь? Найдите книгу, "Цифровые процессоры обработки сигналов". Под ред. Остапенко А.Г., 1994, 264с. Там есть приложение 1 "Пример проектирования модуля синтезатора речи на бис км1813ве1", приведено немного теории и программа синтеза речи (с.196-217). Процессор в приложении работает на частоте 6.144МГц, т.е. одна команда выполняется за 651 нс (4 клока), так что, как видите, современные аврки помощнее будут, особенно с командами, выполняемыми за 50 нс (20МГц такт). Всего 21 команда. Единственное преимущество у данного процессора - это длина аккумулятора - 25 бит. Теперь выбор за вами, сможете сделать синтезатор на авр или нет, так сказать, или грудь в крестах или голова в кустах. Решайтесь. -------------------- Делай сразу хорошо, плохо само получится

SasaVitebsk Просмотр профиля	Mar 10 2007, 10:23 Сообщение #10
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Синтез речи - задача решаемая. Распознавание - нет.

acex2 Просмотр профиля	Mar 10 2007, 10:35 Сообщение #11
Адепт Группа: Свой Сообщений: 520 Регистрация: 15-02-05 Пользователь №: 2 656	Цитата(SasaVitebsk @ Mar 10 2007, 00:57) Реально для кого? Для вас или для вопрошающего? При помощи вот такой штуки http://www.sensoryinc.com/html/products/vrstamp.html даже начинающий сможет справиться с задачей. Необязательно иметь "хороший коллектив, имеющий приличные знания в разных областях", который будет все разрабатывать с нуля, когда есть готовые решения, уже разработанные другим "хорошим коллективом, имеющим приличные знания в разных областях".

muravei Просмотр профиля	Mar 10 2007, 10:37 Сообщение #12
Гуру Группа: Свой Сообщений: 2 538 Регистрация: 13-08-05 Пользователь №: 7 591	Цитата(SasaVitebsk @ Mar 10 2007, 10:23) Синтез речи - задача решаемая. Я бы сказал, условно решаемая, то что возможно назвать синтезом нельзя, можно цифровым магнитофоном.

VAHOO Просмотр профиля	Mar 10 2007, 12:46 Сообщение #13
Частый гость Группа: Участник Сообщений: 163 Регистрация: 22-09-05 Пользователь №: 8 834	а что вы думайте об этом? http://cxem.net/sprav/sprav86.php -------------------- Прошивка это душа микроконтроллера!

VDG Просмотр профиля	Mar 10 2007, 14:15 Сообщение #14
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	Цитата(VAHOO @ Mar 10 2007, 12:46) а что вы думайте об этом?... ..."синтеза реци" Только для синтеза реци и подходят. Я предложил вам сначала поиграться с говорилками, которым хватает только ресурсов компа. Если качеством удовлетворитесь, то смотрите в сторону ДСП. Но как сказали выше, самому вам это не сделать.

Kuzmi4 Просмотр профиля	Mar 10 2007, 16:31 Сообщение #15
Гуру Группа: Свой Сообщений: 3 304 Регистрация: 13-02-07 Из: 55°55′5″ 37°52′16″ Пользователь №: 25 329	2 VAHOO - в обсчем то , если надо устройство, что распознаёт речь(это к тому - "...что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил...") - то вот собсно ссылка - там ребята на авр-ке сваяли чтото типа того о чём спрашивалось.. Идея интересная...Но действительно на авр-ке собрать полноценное устройство чтоб УСё понимало - вряд-ли...действительно лучше смотреть в сторону дсп.. http://instruct1.cit.cornell.edu/courses/e...ndex.html#intro Наслаждайтесь - :-)

GDaniloff Просмотр профиля	Mar 10 2007, 21:05 Сообщение #16
Участник Группа: Новичок Сообщений: 20 Регистрация: 10-03-07 Пользователь №: 26 032	Да... Посмеялся. Вообще-то мне попадались "говорящие часы" за 60 руб, да и телефон "Русь" разговаривает. Есть системы типа голосовой почты, они голосом сообщают куда нажать, человек нажимает... Думаю такой вариант более реален чем распознавание речи А с распознавалками игрался - ничего путного Сперва приучи его к своему голосу, пять раз каждое слово проговори (а их не меньше миллиона!) а потом он еще и путает...

pokos Просмотр профиля	Mar 11 2007, 23:15 Сообщение #17
Местный Группа: Участник Сообщений: 270 Регистрация: 29-06-06 Пользователь №: 18 445	Ну, товарищи, не всё так мрачно.... Мой былой телефон Ерикссон 320 прекраснораспознавал заранее записанные голосовые метки. А нинешний Ноккио Е60 распознаёт и вовсе "с листа". Так что, думаю, задача для Меги вполне решаемая. Что касается синтеза, то тут единственно приемлемый вариант - это воспроизведение заранее записанных сообщений... Иначе роботический акцент просто ужасный. Что касается компьютера, то штатное голосовое средство Вынь 2000 прекрасно понимало мою английскую речь. После обучения, понятно.

VDG Просмотр профиля	Mar 11 2007, 23:28 Сообщение #18
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	> Так что, думаю, задача для Меги вполне решаемая. канеш справится. у меги 16 мипсов у дсп в мобилке под сотню

Doka Просмотр профиля	Mar 12 2007, 00:43 Сообщение #19
Electrical Engineer Группа: СуперМодераторы Сообщений: 2 163 Регистрация: 4-10-04 Пользователь №: 778	Цитата(=GM= @ Mar 10 2007, 02:29) ..Найдите книгу, "Цифровые процессоры обработки сигналов". Под ред. Остапенко А.Г., 1994, 264с. Там есть приложение 1 "Пример проектирования модуля синтезатора речи на бис км1813ве1", приведено немного теории и программа синтеза речи (с.196-217). где б еще найти ее.. ни поиск в веб, ни в пиринговых сетях не увенчались успехом :( Цитата(Kuzmi4 @ Mar 10 2007, 16:31) http://instruct1.cit.cornell.edu/courses/e...ndex.html#intro Наслаждайтесь - :-) да.. преинтересный ресурс).. сначала выплывали ссылки на аудио-спектроанализатор на AVR. Теперь вот распознавание команд (притом с достоверностью 90-100% !!). видимо формула успеха - хороший научный руководитель и адекватность исполнителей. -------------------- Блог iDoka.ru CV linkedin.com/in/iDoka Sources github.com/iDoka Never stop thinking...........................

=GM= Просмотр профиля	Mar 12 2007, 02:13 Сообщение #20
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Doka @ Mar 11 2007, 21:43) Цитата(=GM= @ Mar 10 2007, 02:29) ..Найдите книгу, "Цифровые процессоры обработки сигналов". Под ред. Остапенко А.Г., 1994, 264с. Там есть приложение 1 "Пример проектирования модуля синтезатора речи на бис км1813ве1", приведено немного теории и программа синтеза речи (с.196-217). где б еще найти ее.. ни поиск в веб, ни в пиринговых сетях не увенчались успехом У меня есть бумажный экземпляр. Давай я тебе отсканирую оглавление, а ты выберешь, что конкретно тебе надо. -------------------- Делай сразу хорошо, плохо само получится

Kuzmi4 Просмотр профиля	Mar 12 2007, 11:02 Сообщение #21
Гуру Группа: Свой Сообщений: 3 304 Регистрация: 13-02-07 Из: 55°55′5″ 37°52′16″ Пользователь №: 25 329	2 =GM= - а можно и мне экземплярчик оглавления?

GL_basik Просмотр профиля	Mar 12 2007, 11:40 Сообщение #22
Участник Группа: Участник Сообщений: 68 Регистрация: 19-07-06 Пользователь №: 18 918	В процессе прочтения. Возникла простая и тупая до ужаса идея. Не использовать реал-тайм. Записывать команду а потом обрабатывать. Если записать достаточно отсчетов, то с задачей рапознавания справится простой коррелятор, который вполне возможно собрать на меге. Если идея интересна то нужно запрячь матлаб. В принципе на меге даже адаптивную фильтрацию можно реализовать. Но работать все это будет очень медленно и достаточно криво.

=GM= Просмотр профиля	Mar 12 2007, 12:51 Сообщение #23
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Kuzmi4 @ Mar 12 2007, 08:02) 2 =GM= - а можно и мне экземплярчик оглавления? Книга дома, вечером могу выложить, скажите только куда? -------------------- Делай сразу хорошо, плохо само получится

Kuzmi4 Просмотр профиля	Mar 12 2007, 13:02 Сообщение #24
Гуру Группа: Свой Сообщений: 3 304 Регистрация: 13-02-07 Из: 55°55′5″ 37°52′16″ Пользователь №: 25 329	2 =GM= - Во первых спасиба. Ну а на счёт выложить - в принципе мне всё равно, оптимальный вариант конечно - если не проблемно, то вышлите на мыло..

VAHOO Просмотр профиля	Mar 12 2007, 14:40 Сообщение #25
Частый гость Группа: Участник Сообщений: 163 Регистрация: 22-09-05 Пользователь №: 8 834	за ответи спасибо! если не трудно мне тоже отправьте vahagnh@rambler.ru -------------------- Прошивка это душа микроконтроллера!

Doka Просмотр профиля	Mar 12 2007, 14:45 Сообщение #26
Electrical Engineer Группа: СуперМодераторы Сообщений: 2 163 Регистрация: 4-10-04 Пользователь №: 778	Цитата(=GM= @ Mar 12 2007, 12:51) Книга дома, вечером могу выложить, скажите только куда? можно попробовать залить на новый файловый сервис (кнопка "Загрузить файлы" в верхнем меню, доступ кнему имеют все участники) - потом просто сюда ссылку дадите. -------------------- Блог iDoka.ru CV linkedin.com/in/iDoka Sources github.com/iDoka Never stop thinking...........................

pokos Просмотр профиля	Mar 12 2007, 16:12 Сообщение #27
Местный Группа: Участник Сообщений: 270 Регистрация: 29-06-06 Пользователь №: 18 445	Цитата(VDG @ Mar 11 2007, 23:28) канеш справится. у меги 16 мипсов у дсп в мобилке под сотню Нуко-нуко, поподробней, какая такая ДСПшка в Ерикссоне Р320?

VDG Просмотр профиля	Mar 12 2007, 19:08 Сообщение #28
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	Цитата(pokos @ Mar 12 2007, 16:12) Нуко-нуко, поподробней, какая такая ДСПшка в Ерикссоне Р320? А это не вам адресовалось ARM там, ARM...

SasaVitebsk Просмотр профиля	Mar 12 2007, 21:46 Сообщение #29
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Ребята, когда у меня спрашивают: "Можно ли реализовать то или это?", то ответ однозначный - "Да". Всегда. Вопрос в другом, - сколько времени сил и средств на это будет потрачено. Иными словами вопрос следует формулировать несколько иначе: "Целесообразно ли ... ?". Ответ будет - "НЕТ!" Для данной темы - с 99% вероятностью автор вопроса не справится с данной задачей и даже будет не в состоянии финансировать её завершение. Конечно, если говорить о сколько-нибудь коммерческом качестве. Поэтому, подытоживая: Да, реализовать можно, но придётся провести исследовательскую работу (включая спектральный анализ голосов десятков человек) большого объёма + изучить теорию значительного объёма + провести различное моделирование - И ПОТОМ ОПРЕДЕЛЯТСЯ ПО ПОВОДУ РЕАЛИЗАЦИИ. А именно выбрать камень для реализации и сопутствующие аппаратные ресурсы. Реально это для одного человека? Да - если этому посвятить ВСЮ жизнь. Такие темы так просто не отпускают! Если вы потратите лет 10 и добьётесь сколь-нибудь значимых успехов, то вас с руками оторвут коммерческие фирмы. Так как вы будете к этому моменту СПЕЦИАЛИСТОМ. Надо ли вам это? Это решать вам.

VAHOO Просмотр профиля	Mar 12 2007, 22:39 Сообщение #30
Частый гость Группа: Участник Сообщений: 163 Регистрация: 22-09-05 Пользователь №: 8 834	по моему я не первый кто подумал об этом, я думаю что не может быть чтобы не было уже готовых таких проектов, я не хочу заного преобретать велосипед. Может мы вместе придумаем ответ по этому поводу. Я не хочу создать интеллектуальный апарат который будет понемать все что я скажу, просто мне надо что бы он понял некоторые команды (слова), и не только моим голосом. По моему уже есть такие микросхемы распознавание речи. -------------------- Прошивка это душа микроконтроллера!

VDG Просмотр профиля	Mar 12 2007, 23:49 Сообщение #31
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	То что есть имеет сильные ограничения. Поэтому области применения очень специализированные, например, военная техника, кое-где требует голосового управления так как руки заняты. Системы автоматизированного call-центра. Но всё в очень жёстких рамках. Причем заточка на английский язык. Не достигла эта технология того уровня, чтобы её могла "переварить" виндоус. Велосипед ещё не изобретён. Всё что можно выжать из "фурье" уже выжато, это тупиковый путь. А то как распознаёт живой мозг ещё науке не известно. Даже как улитка раскладывает звук по частотам до сих пор гадают. И прогресса в этой области лет 50 ещё не будет. -------------------- студия разработки электроники

=GM= Просмотр профиля	Mar 13 2007, 00:16 Сообщение #32
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Doka @ Mar 12 2007, 11:45) Цитата(=GM= @ Mar 12 2007, 12:51) Книга дома, вечером могу выложить, скажите только куда? можно попробовать залить на новый файловый сервис (кнопка "Загрузить файлы" в верхнем меню, доступ кнему имеют все участники) - потом просто сюда ссылку дадите. Вроде загрузил, файл: ostapenko.zip, 1827 КБ. -------------------- Делай сразу хорошо, плохо само получится

Kuzmi4 Просмотр профиля	Mar 13 2007, 10:01 Сообщение #33
Гуру Группа: Свой Сообщений: 3 304 Регистрация: 13-02-07 Из: 55°55′5″ 37°52′16″ Пользователь №: 25 329	2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило....

=GM= Просмотр профиля	Mar 13 2007, 14:45 Сообщение #34
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Kuzmi4 @ Mar 13 2007, 07:01) 2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило.... Первый блин комом, прошу пардону, код дома(:-). Вечером сделаю. -------------------- Делай сразу хорошо, плохо само получится

trofim Просмотр профиля	Mar 13 2007, 17:23 Сообщение #35
Группа: Новичок Сообщений: 12 Регистрация: 4-11-04 Пользователь №: 1 039	2 SasaVitebsk Синтез речи - задача решаемая. Распознавание - нет. [/quote] Можно спросить каким образом реализовать простой синтез, даже роботизированный?

VDG Просмотр профиля	Mar 13 2007, 20:05 Сообщение #36
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	Цитата(trofim @ Mar 13 2007, 17:23) Можно спросить каким образом реализовать простой синтез, даже роботизированный? Просто выводите фонемы. Ну а сглаживание перехода между фонемами вещь уже не тривиальная. -------------------- студия разработки электроники

=GM= Просмотр профиля	Mar 13 2007, 23:15 Сообщение #37
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Kuzmi4 @ Mar 13 2007, 07:01) 2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило.... Код такой: YkcpTAm1DFM3SAd, ссылка http://nukeuploads.com/download/1173816980...apenko.zip.html -------------------- Делай сразу хорошо, плохо само получится

Kuzmi4 Просмотр профиля	Mar 14 2007, 10:20 Сообщение #38
Гуру Группа: Свой Сообщений: 3 304 Регистрация: 13-02-07 Из: 55°55′5″ 37°52′16″ Пользователь №: 25 329	2 =GM= - спасиба..Псмотрел на оглавление - книга страшная ... Тогда до кучи если можно ещё П1.3 -это там где программа синтезатора речи - схемку уже посмотрел, но описание к ней , типа - "...сигнал первой форманты..." - почему то вызывает чувство страха.....

trofim Просмотр профиля	Mar 14 2007, 10:39 Сообщение #39
Группа: Новичок Сообщений: 12 Регистрация: 4-11-04 Пользователь №: 1 039	А где бы можно найти библиотеку фонем?

Doka Просмотр профиля	Mar 14 2007, 12:52 Сообщение #40
Electrical Engineer Группа: СуперМодераторы Сообщений: 2 163 Регистрация: 4-10-04 Пользователь №: 778	Цитата(=GM= @ Mar 13 2007, 23:15) Код такой: YkcpTAm1DFM3SAd, ссылка http://nukeuploads.com/download/1173816980...apenko.zip.html cпасибо!. еще бы разворот с.198-199 (продолжение П1.2) Цитата(Kuzmi4 @ Mar 14 2007, 10:20) Тогда до кучи если можно ещё П1.3 -это там где программа синтезатора речи - схемку уже посмотрел, но описание к ней , типа - "...сигнал первой форманты..." - почему то вызывает чувство страха..... а вот ИМХО, всеже проще по структурной схеме побыстрому в матлабе наваять модельку, чем ковыряться в 20страничном ассемблерном листинге, силясь понять как это работает... едиснтвенное ,что там наверное можно полезного почерпнуть - таблицу формант. -------------------- Блог iDoka.ru CV linkedin.com/in/iDoka Sources github.com/iDoka Never stop thinking...........................

=GM= Просмотр профиля	Mar 15 2007, 00:40 Сообщение #41
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Doka @ Mar 14 2007, 09:52) cпасибо!. еще бы разворот с.198-199 (продолжение П1.2) а вот ИМХО, все же проще по структурной схеме побыстрому в матлабе наваять модельку, чем ковыряться в 20страничном ассемблерном листинге, силясь понять как это работает... единственное, что там наверное можно полезного почерпнуть - таблицу формант. Там меньше 7 страниц кода(:-). Если знаешь, что ваять, тогда проще, само собой разумеется... В общем я подумал-подумал, и копирнул всё приложение 1, пожал малёк, всего 3МБ на 22 страницы. Файл http://nukeuploads.com/download/1173907975...pendix.zip.html Код JEDYRJbcZF9yVRh -------------------- Делай сразу хорошо, плохо само получится

trofim Просмотр профиля	Mar 15 2007, 13:19 Сообщение #42
Группа: Новичок Сообщений: 12 Регистрация: 4-11-04 Пользователь №: 1 039	Не так много, можно и поразбираться, но сначала нужно найти типа библиотеки формант или еще чего подобного. Без этого разбираться смысла нет.

VAHOO Просмотр профиля	Mar 15 2007, 23:01 Сообщение #43
Частый гость Группа: Участник Сообщений: 163 Регистрация: 22-09-05 Пользователь №: 8 834	Вот еще ссылки http://www.imagesco.com/speech/speech-recognition-index.html http://www.talkingelectronics.com/John/Spe...ecognition.html -------------------- Прошивка это душа микроконтроллера!

SasaVitebsk Просмотр профиля	Mar 16 2007, 01:29 Сообщение #44
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Цитата(trofim @ Mar 13 2007, 18:23) 2 SasaVitebsk Синтез речи - задача решаемая. Распознавание - нет. Можно спросить каким образом реализовать простой синтез, даже роботизированный? Я не утверждал, что задача простая. Я написал - решаемая. Объясню почему. В общем случае МК нет необходимости знать что именно он произносит. В этом случае звучание будет не очень, но человек - опознает. В своё время я печатал один документ по DELFI. Меня интересовали потоки. Чтобы уменьшить колличество используемой бумаги я распечатал текст в виде брошуры (с помощью FinePrint) 4 листа на А4 лист. Ну и сижу читаю. Подходит ко мне сын. Долго смотрит, потом спрашивает что ты делаешь? Читаю. Я потом провёл эксперимент. Оказывается он не мог прочесть практически ни одного слова. При сжатии и дальнейшей печати символы исказились почти до неузнаваемости. При этом я прекрасно читал, и не замечал этого! Причина проста. Я понимал, что там написано, - он - нет! Что "скажет" МК - мы поймём даже при сильном искажении, а он будет ошибаться, даже если мы будем по слогам читать. Приведенные ссылки - это не мк. Там описаны мк С ПРОГРАМНЫМ ОБЕСПЕЧЕНИЕМ. Это стоит денег. А самим данные проги не разработать. Ещё раз утверждаю это работа серьёзного коллектива разработчиков на ГОДЫ. Да имеются частные решения для частных случаев. Для сведения: Распознавание речи не имеет ничего общего со сравнением спектров и спектральным анализом. Так только на звук разбитого стекла реагируют. Распознавание речи что-то сродни распознаванию текста (ещё сложнее). Когда распознают букву "А", то её не сравнивают с образцом. Так как имеются различные фонты, есть рукописное написание, при написании может быть разрыв. Поэтому букву преобразуют в набор векторов и работают с векторами. Как не парадоксально, звуки тоже представляют в виде векторов. Дело в том, что буква имеет разный спектр в зависимости от того, где она стоит. (тоже и со слогами) Таким образом необходимо либо сравнивать целые слова либо подходить иначе. Обычно подходят иначе. Как - это вам никто не раскроет. Ещё раз поясняю. Дело не в написании программы. Программу напишет третьекурсник. Дело в громадной исследовательской работе, которую необходимо проделать, чтобы дать задание этому третьекурснику. Данная работа пока не проделана. Но даже когда она будет завершена, - радоваться не стоит. Не следует ждать, что будет выпущен специальный МК. Это должно быть интегрированное решение. МК+набор ПО для распознавания к примеру. И покупая его вы заплатите за МК, за ПО, за лицензию на алгоритм. Этот комплект в настоящий момент будет очень дорог! Так как тысячи предприятий были бы готовы его купить хоть сейчас. Кроме того данная задача требует огромных вычислительных ресурсов и большого объёма оперативной памяти. Я это оцениваю в мегабайты. Я думаю синтез с приемлемым качеством можно реализовать на AVR. Безусловно потребуются внешние элементы. Как минимум дополнительная флэш-память.

CD_Eater Просмотр профиля	Mar 16 2007, 14:01 Сообщение #45
Частый гость Группа: Новичок Сообщений: 173 Регистрация: 3-09-04 Из: Moscow Пользователь №: 595	Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук! Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции).

trofim Просмотр профиля	Mar 16 2007, 16:30 Сообщение #46
Группа: Новичок Сообщений: 12 Регистрация: 4-11-04 Пользователь №: 1 039	Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го.

SasaVitebsk Просмотр профиля	Mar 17 2007, 00:25 Сообщение #47
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Цитата(CD_Eater @ Mar 16 2007, 15:01) Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук! Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции). Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. Я считаю, что даже распознавание Цитата фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся.

Doka Просмотр профиля	Mar 17 2007, 13:24 Сообщение #48
Electrical Engineer Группа: СуперМодераторы Сообщений: 2 163 Регистрация: 4-10-04 Пользователь №: 778	Цитата(SasaVitebsk @ Mar 17 2007, 00:25) Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. :biggrin: изначально говорилось об этом: Цитата(VAHOO @ Mar 9 2007, 23:11) мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответит можно через SD CARD или скажем ISD2560, но как распознавать речь? Цитата(SasaVitebsk @ Mar 17 2007, 00:25) Я считаю, что даже распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся. ссылка уже приводилась в этом топике: http://instruct1.cit.cornell.edu/courses/e...ndex.html#intro сделано именно на AVR . В таблицах 2-5 приведены вероятности правильного распознавания (результаты эксперимента). Исходники брать там же. И вводите в заблуждение людей.. -------------------- Блог iDoka.ru CV linkedin.com/in/iDoka Sources github.com/iDoka Never stop thinking...........................

SasaVitebsk Просмотр профиля	Mar 17 2007, 22:16 Сообщение #49
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Значит это я ввожу в заблуждение людей. И приведенный проект тому подтверждение. Когда на голову человека падает кирпич, то один скажет: боже, почему всё это падает на меня, - вот не везёт второй скажет: вот это повезло - другого бы убило Вы похоже скажете: блин чуть не попало. По-моему приведенный пример - ярчайшее подтверждение моих слов. Это ещё один пример, как потратив год работы можно лажануться. Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются. Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM". Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. Хотя я бы не дал. Извините, но оттуда копировать просто НЕЧЕГО.

Doka Просмотр профиля	Mar 18 2007, 22:34 Сообщение #50
Electrical Engineer Группа: СуперМодераторы Сообщений: 2 163 Регистрация: 4-10-04 Пользователь №: 778	Цитата(SasaVitebsk @ Mar 17 2007, 22:16) Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются. links, rechts (по произношению различаются не сильнее чем left/right) а вы предлагаете в качестве команд использовать слова вроде: "демобилизация", "идиосинкразия" ? кхм.. Цитата(SasaVitebsk @ Mar 17 2007, 22:16) Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM". Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. в качестве промежуточного результата могли и не такую вероятность получить.. при использовании обучения (см.далее в оригинальной статье) на словаре из 8ми слов получили минимальную вероятность распознавания в 85% (и то только на одном слове - более половины слов определяются с вероятностью в 100%). насчет цены - странно, вы к этому придрались.. это дипломный приект и в качестве справки просто приведена стоимость ВОМ. тут помоему должно быть всё ясно: железо отдельно - исследовательская работа отдельно. Цитата(SasaVitebsk @ Mar 17 2007, 22:16) Извините, но оттуда копировать просто НЕЧЕГО. забыли добавить - "ИМХО". авторы использовали простейший подход - выделение полос фильтрами, однако приводят иные методы - улучшающие точность. да, и главное: как раз такие проекты (и тут скорее не как "проекты-для-копирования" а как "проекты-прецеденты") "когда (хоть и не 1) человек сделал на AVR и добился определенных результатов" и помогают снять ограничивающие убеждения, не позволяющие не только прочувствовать возможность реализации "в прнципе", но и мещающие инженеру быть эффективным (ставить творческие задачи, здраво оценивать трудоемкость, анализировать существующие разработки, штудировать (если придется) стопки литературы) -------------------- Блог iDoka.ru CV linkedin.com/in/iDoka Sources github.com/iDoka Never stop thinking...........................

SasaVitebsk Просмотр профиля	Mar 18 2007, 23:06 Сообщение #51
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Не буду с вами спорить. У нас просто разные взгляды на вещи. Например человеку, который порядочный на 85% после обучения, - я бы деньги не отдал. Но собственно не о том разговор. Этот проект всё равно не подойдёт для начинающего. (А разбирающийся за него сам не возьмётся) Причина проста. Даже перевести его на русский словарь (насколько я понял при беглом просмотре) - это уже не совсем простая операция требующая определённых знаний отнюдь не в программировании. И ещё повторюсь. На вопрос "можно ли?" - отвечу "да" На вопрос "целесообразно ли?" - отвечу "нет". Причина - надо длительные и трудоёмкие исследования.

CD_Eater Просмотр профиля	Mar 18 2007, 23:44 Сообщение #52
Частый гость Группа: Новичок Сообщений: 173 Регистрация: 3-09-04 Из: Moscow Пользователь №: 595	85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Да и люди, порядочные более чем на 85% в наше время - большая редкость.

SasaVitebsk Просмотр профиля	Mar 19 2007, 15:29 Сообщение #53
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Цитата(CD_Eater @ Mar 19 2007, 00:44) 85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Да и люди, порядочные более чем на 85% в наше время - большая редкость. По первому - то сотовый телефон, а то секьюрити. По второму - Вас видимо кто-то обидел. Забавно когда ко мне менты приходят, а я их куда-нибудь пытаюсь перенаправить. Типовая фраза такая: - Саша тебе доверяю, а другим нет. - Почему? - Так кругом же бандиты!!! Не знаю вокруг меня "отличные люди". Всё таки порядочный человек на 85% - это уже непорядочный. К тому же после обучения.

DUB00035 Просмотр профиля	Dec 30 2012, 15:26 Сообщение #54
Группа: Новичок Сообщений: 6 Регистрация: 30-12-12 Пользователь №: 75 024	Оптимизация Синтезатора Речи ---возможно кого-либо заинтересует: http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s

alexf Просмотр профиля	Jan 1 2013, 01:56 Сообщение #55
Местный Группа: Свой Сообщений: 420 Регистрация: 22-12-04 Пользователь №: 1 608	Цитата(CD_Eater @ Mar 18 2007, 15:44) 85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Видимо сил-но зависит от системы. Голосовым набором я пользую только за рулем и там участвует встроенный BT, но цифры распознаются на 100%. Естественно все работает не на AVR Что касается произвольного текста, то даже лучшие программы типа Dragon Dictate на много-гигагерцовых PC и полном словаре под рукой далеки от 100%.

perfect Просмотр профиля	Jan 1 2013, 08:17 Сообщение #56
Знающий Группа: Участник Сообщений: 565 Регистрация: 13-03-10 Пользователь №: 55 932	Вообще не в теме, но думаю что если распознающий не понимает говорящего, то говорящему нужно снизойти до распознающего. Простейший расппознающий, я думаю, где-то на двоичном уровне, что-то вроде морзянки, RC5 протокола для телевизоров или DiSEqC Ну, ничё не поделааешь, говорящему придётся издавать пачки звуков-пауз из очень ограниченного лексикона.

ARV Просмотр профиля	Jan 1 2013, 09:03 Сообщение #57
Профессионал Группа: Свой Сообщений: 1 143 Регистрация: 30-09-08 Из: Новочеркасск Пользователь №: 40 581	а в андроиде встроено распознавание - в моих попытках все мои слова, сказанные спокойно по одному слову, распознаются на 100%. насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы, но факт говорит сам за себя - отдельные слова распознаются отлично и безошибочно. что касается распознавания на AVR, то с определенными ограничениями мне эта задача представляется решаемой, т.к. были прецеденты на PIC, а PIC не далеко от AVR ушел, и даже скорее отстает в плане производительности: http://www.530.ru/electronics/projects.php?do=p124 -------------------- Я бы взял частями... но мне надо сразу.

perfect Просмотр профиля	Jan 1 2013, 09:21 Сообщение #58
Знающий Группа: Участник Сообщений: 565 Регистрация: 13-03-10 Пользователь №: 55 932	Цитата(ARV @ Jan 1 2013, 13:03) насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы Колоссальные ресурсы можно представить и как колоссальные людские ресурсы

LexaK Просмотр профиля	Jan 10 2013, 06:41 Сообщение #59
Частый гость Группа: Свой Сообщений: 118 Регистрация: 3-12-06 Из: Новороссийск Пользователь №: 23 082	Все придумано до нас. Чипы RSC-4128 фирмы Sensory. Подробно тут

hd44780 Просмотр профиля	Jan 10 2013, 11:48 Сообщение #60
Профессионал Группа: Свой Сообщений: 1 202 Регистрация: 26-08-05 Из: Донецк, ДНР Пользователь №: 7 980	Цитата(ARV @ Jan 1 2013, 11:03) я понял, это все делается через интернет Скорее всего. Вот тут - http://habrahabr.ru/post/146501/ делают через гугль и Wi-Fi (то бишь, интернет). Это, конечно, далеко не AVR, но, если надо, то и STM32 не жалко . -------------------- Чтобы возить такого пассажира, необходим лимузин другого класса. (с) Мария Эдуарда

Hmm Просмотр профиля	Jan 10 2013, 12:07 Сообщение #61
Местный Группа: Свой Сообщений: 329 Регистрация: 22-06-04 Пользователь №: 124	Цитата STM32 не жалко можно и "безплатно", напрмер посредством своего смартфона ... -------------------- Талант не пропить ...

MALLOY2 Просмотр профиля	Jan 10 2013, 12:30 Сообщение #62
Знающий Группа: Validating Сообщений: 838 Регистрация: 31-01-05 Пользователь №: 2 317	Может у них спросить, как это просто ? http://newsdesk.pcmag.ru/node/5975

DUB00035 Просмотр профиля	Mar 10 2013, 19:17 Сообщение #63
Группа: Новичок Сообщений: 6 Регистрация: 30-12-12 Пользователь №: 75 024	Цитата(trofim @ Mar 16 2007, 20:30) Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го. Исходники е ? Если нет исходников для speek_r.com то можно тупо перелопатить весь DOSовский EXEшник под нужный процессор , вставляя NOPы дабы не сбить переходы типа JMP , так как длина команд под разные архитектуры процессоров может розниться. Причём транслятор можно написать самому на каком-либо примитивном ЯВУ . Я , когда ускорял speeck_r.com, даже не задумывался как он работает в целом! Нашёл где speeck_r.com выдаёт на 42h звуковой порт, применил 5 идей/приёмов ( см. описание : http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s ) , 1 год возьни с ним , и всё нормально --- любой далёкий от программирования и компьютеров человек различает его речь с 1 раза ! А без "отладки" комп не говорит вообще

DUB00035 Просмотр профиля	Mar 17 2013, 11:06 Сообщение #64
Группа: Новичок Сообщений: 6 Регистрация: 30-12-12 Пользователь №: 75 024	Цитата(DUB00035 @ Dec 30 2012, 19:26) Оптимизация Синтезатора Речи ---возможно кого-либо заинтересует: http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s Для убыстрения синтезатора пришлось заполнять буфер операцией Push --- стрёмный такой способ.

DUB00035 Просмотр профиля	Mar 17 2013, 19:02 Сообщение #65
Группа: Новичок Сообщений: 6 Регистрация: 30-12-12 Пользователь №: 75 024	Цитата(trofim @ Mar 16 2007, 20:30) Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го. Причём голоса рускоговорящих всех DOSовских синтезаторов абсолютно идентичны---будь то speeck , SAY.EXE или Demosfen . Я смотрел коды их --- коды похожи очень. Такое ощущение , что у них единый праПраПраИсходник или/и в их основе Общая диссертация по синтезу звука . Не подскажите , а 1 из вариантов Вашего Sdrv.com случайно не 42636 байт весит ? Дело в том , что у меня такого размера какой-то Synt, и я собираюсь им заняться

trofim2 Просмотр профиля	Mar 23 2013, 16:48 Сообщение #66
Группа: Участник Сообщений: 11 Регистрация: 30-01-13 Пользователь №: 75 410	В свое время дизассемблировал SDRV. и по аналогии написал один к одному (почти) для AVR. Качество работы меня и моих подопытных вполне устроило. Свободного ресурса навалом. Кому надо забирайте. Прикрепленные файлы sdrv.zip ( 204.18 килобайт ) Кол-во скачиваний: 94

DUB00035 Просмотр профиля	Jun 3 2014, 12:45 Сообщение #67
Группа: Новичок Сообщений: 6 Регистрация: 30-12-12 Пользователь №: 75 024	Цитата(DUB00035 @ Dec 30 2012, 23:36) Оптимизация Синтезатора Речи ---возможно кого-либо заинтересует: http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s Изменена Xlat-таблица : теперь на 42h Порт идут только такие значения --- 00000001b или 00000000b ... Звучит также !

« Предыдущая тема · AVR · Следующая тема »

5 страниц

1 2 3 > »

Reply to this topic

Start new topic

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 28th July 2025 - 01:38

Страница сгенерированна за 0.02244 секунд с 7
ELECTRONIX ©2004-2016