|
|
  |
Синтезатор речи |
|
|
|
Mar 13 2007, 00:16
|

Ambidexter
    
Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282

|
Цитата(Doka @ Mar 12 2007, 11:45)  Цитата(=GM= @ Mar 12 2007, 12:51)  Книга дома, вечером могу выложить, скажите только куда? можно попробовать залить на новый файловый сервис (кнопка "Загрузить файлы" в верхнем меню, доступ кнему имеют все участники) - потом просто сюда ссылку дадите. Вроде загрузил, файл: ostapenko.zip, 1827 КБ.
--------------------
Делай сразу хорошо, плохо само получится
|
|
|
|
|
Mar 13 2007, 17:23
|
Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039

|
2 SasaVitebsk Синтез речи - задача решаемая. Распознавание - нет. [/quote] Можно спросить каким образом реализовать простой синтез, даже роботизированный?
|
|
|
|
|
Mar 14 2007, 10:39
|
Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039

|
А где бы можно найти библиотеку фонем?
|
|
|
|
|
Mar 15 2007, 00:40
|

Ambidexter
    
Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282

|
Цитата(Doka @ Mar 14 2007, 09:52)  cпасибо!. еще бы разворот с.198-199 (продолжение П1.2) а вот ИМХО, все же проще по структурной схеме побыстрому в матлабе наваять модельку, чем ковыряться в 20страничном ассемблерном листинге, силясь понять как это работает...
единственное, что там наверное можно полезного почерпнуть - таблицу формант. Там меньше 7 страниц кода(:-). Если знаешь, что ваять, тогда проще, само собой разумеется... В общем я подумал-подумал, и копирнул всё приложение 1, пожал малёк, всего 3МБ на 22 страницы. Файл http://nukeuploads.com/download/1173907975...pendix.zip.htmlКод JEDYRJbcZF9yVRh
--------------------
Делай сразу хорошо, плохо само получится
|
|
|
|
|
Mar 15 2007, 13:19
|
Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039

|
Не так много, можно и поразбираться, но сначала нужно найти типа библиотеки формант или еще чего подобного. Без этого разбираться смысла нет.
|
|
|
|
|
Mar 16 2007, 01:29
|
Гуру
     
Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521

|
Цитата(trofim @ Mar 13 2007, 18:23)  2 SasaVitebsk Синтез речи - задача решаемая. Распознавание - нет.
Можно спросить каким образом реализовать простой синтез, даже роботизированный? Я не утверждал, что задача простая. Я написал - решаемая. Объясню почему. В общем случае МК нет необходимости знать что именно он произносит. В этом случае звучание будет не очень, но человек - опознает. В своё время я печатал один документ по DELFI. Меня интересовали потоки. Чтобы уменьшить колличество используемой бумаги я распечатал текст в виде брошуры (с помощью FinePrint) 4 листа на А4 лист. Ну и сижу читаю. Подходит ко мне сын. Долго смотрит, потом спрашивает что ты делаешь? Читаю. Я потом провёл эксперимент. Оказывается он не мог прочесть практически ни одного слова. При сжатии и дальнейшей печати символы исказились почти до неузнаваемости. При этом я прекрасно читал, и не замечал этого! Причина проста. Я понимал, что там написано, - он - нет! Что "скажет" МК - мы поймём даже при сильном искажении, а он будет ошибаться, даже если мы будем по слогам читать. Приведенные ссылки - это не мк. Там описаны мк С ПРОГРАМНЫМ ОБЕСПЕЧЕНИЕМ. Это стоит денег. А самим данные проги не разработать. Ещё раз утверждаю это работа серьёзного коллектива разработчиков на ГОДЫ. Да имеются частные решения для частных случаев. Для сведения: Распознавание речи не имеет ничего общего со сравнением спектров и спектральным анализом. Так только на звук разбитого стекла реагируют.  Распознавание речи что-то сродни распознаванию текста (ещё сложнее). Когда распознают букву "А", то её не сравнивают с образцом. Так как имеются различные фонты, есть рукописное написание, при написании может быть разрыв. Поэтому букву преобразуют в набор векторов и работают с векторами. Как не парадоксально, звуки тоже представляют в виде векторов. Дело в том, что буква имеет разный спектр в зависимости от того, где она стоит. (тоже и со слогами) Таким образом необходимо либо сравнивать целые слова либо подходить иначе. Обычно подходят иначе. Как - это вам никто не раскроет. Ещё раз поясняю. Дело не в написании программы. Программу напишет третьекурсник. Дело в громадной исследовательской работе, которую необходимо проделать, чтобы дать задание этому третьекурснику. Данная работа пока не проделана. Но даже когда она будет завершена, - радоваться не стоит. Не следует ждать, что будет выпущен специальный МК. Это должно быть интегрированное решение. МК+набор ПО для распознавания к примеру. И покупая его вы заплатите за МК, за ПО, за лицензию на алгоритм. Этот комплект в настоящий момент будет очень дорог! Так как тысячи предприятий были бы готовы его купить хоть сейчас. Кроме того данная задача требует огромных вычислительных ресурсов и большого объёма оперативной памяти. Я это оцениваю в мегабайты. Я думаю синтез с приемлемым качеством можно реализовать на AVR. Безусловно потребуются внешние элементы. Как минимум дополнительная флэш-память.
|
|
|
|
|
Mar 16 2007, 14:01
|
Частый гость
 
Группа: Новичок
Сообщений: 173
Регистрация: 3-09-04
Из: Moscow
Пользователь №: 595

|
Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук!
Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции).
|
|
|
|
|
  |
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|