Синтезатор речи - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Wiki

Photo

Forum

Forum

Reviews

Reviews

Help (!)

Help (!)

Правила Форума

Пользователи

Календарь

Личная почта

Панель управления

Форум разработчиков электроники ELECTRONIX.ru > Микроконтроллеры (MCs) > AVR

5 страниц

< 1 2 3 4 5 >

Reply to this topic

Start new topic

Синтезатор речи

VDG Просмотр профиля	Mar 12 2007, 23:49 Сообщение #31
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	То что есть имеет сильные ограничения. Поэтому области применения очень специализированные, например, военная техника, кое-где требует голосового управления так как руки заняты. Системы автоматизированного call-центра. Но всё в очень жёстких рамках. Причем заточка на английский язык. Не достигла эта технология того уровня, чтобы её могла "переварить" виндоус. Велосипед ещё не изобретён. Всё что можно выжать из "фурье" уже выжато, это тупиковый путь. А то как распознаёт живой мозг ещё науке не известно. Даже как улитка раскладывает звук по частотам до сих пор гадают. И прогресса в этой области лет 50 ещё не будет. -------------------- студия разработки электроники

=GM= Просмотр профиля	Mar 13 2007, 00:16 Сообщение #32
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Doka @ Mar 12 2007, 11:45) Цитата(=GM= @ Mar 12 2007, 12:51) Книга дома, вечером могу выложить, скажите только куда? можно попробовать залить на новый файловый сервис (кнопка "Загрузить файлы" в верхнем меню, доступ кнему имеют все участники) - потом просто сюда ссылку дадите. Вроде загрузил, файл: ostapenko.zip, 1827 КБ. -------------------- Делай сразу хорошо, плохо само получится

Kuzmi4 Просмотр профиля	Mar 13 2007, 10:01 Сообщение #33
Гуру Группа: Свой Сообщений: 3 304 Регистрация: 13-02-07 Из: 55°55′5″ 37°52′16″ Пользователь №: 25 329	2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило....

=GM= Просмотр профиля	Mar 13 2007, 14:45 Сообщение #34
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Kuzmi4 @ Mar 13 2007, 07:01) 2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило.... Первый блин комом, прошу пардону, код дома(:-). Вечером сделаю. -------------------- Делай сразу хорошо, плохо само получится

trofim Просмотр профиля	Mar 13 2007, 17:23 Сообщение #35
Группа: Новичок Сообщений: 12 Регистрация: 4-11-04 Пользователь №: 1 039	2 SasaVitebsk Синтез речи - задача решаемая. Распознавание - нет. [/quote] Можно спросить каким образом реализовать простой синтез, даже роботизированный?

VDG Просмотр профиля	Mar 13 2007, 20:05 Сообщение #36
Знающий Группа: Участник Сообщений: 845 Регистрация: 10-02-06 Пользователь №: 14 193	Цитата(trofim @ Mar 13 2007, 17:23) Можно спросить каким образом реализовать простой синтез, даже роботизированный? Просто выводите фонемы. Ну а сглаживание перехода между фонемами вещь уже не тривиальная. -------------------- студия разработки электроники

=GM= Просмотр профиля	Mar 13 2007, 23:15 Сообщение #37
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Kuzmi4 @ Mar 13 2007, 07:01) 2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило.... Код такой: YkcpTAm1DFM3SAd, ссылка http://nukeuploads.com/download/1173816980...apenko.zip.html -------------------- Делай сразу хорошо, плохо само получится

Kuzmi4 Просмотр профиля	Mar 14 2007, 10:20 Сообщение #38
Гуру Группа: Свой Сообщений: 3 304 Регистрация: 13-02-07 Из: 55°55′5″ 37°52′16″ Пользователь №: 25 329	2 =GM= - спасиба..Псмотрел на оглавление - книга страшная ... Тогда до кучи если можно ещё П1.3 -это там где программа синтезатора речи - схемку уже посмотрел, но описание к ней , типа - "...сигнал первой форманты..." - почему то вызывает чувство страха.....

trofim Просмотр профиля	Mar 14 2007, 10:39 Сообщение #39
Группа: Новичок Сообщений: 12 Регистрация: 4-11-04 Пользователь №: 1 039	А где бы можно найти библиотеку фонем?

Doka Просмотр профиля	Mar 14 2007, 12:52 Сообщение #40
Electrical Engineer Группа: СуперМодераторы Сообщений: 2 163 Регистрация: 4-10-04 Пользователь №: 778	Цитата(=GM= @ Mar 13 2007, 23:15) Код такой: YkcpTAm1DFM3SAd, ссылка http://nukeuploads.com/download/1173816980...apenko.zip.html cпасибо!. еще бы разворот с.198-199 (продолжение П1.2) Цитата(Kuzmi4 @ Mar 14 2007, 10:20) Тогда до кучи если можно ещё П1.3 -это там где программа синтезатора речи - схемку уже посмотрел, но описание к ней , типа - "...сигнал первой форманты..." - почему то вызывает чувство страха..... а вот ИМХО, всеже проще по структурной схеме побыстрому в матлабе наваять модельку, чем ковыряться в 20страничном ассемблерном листинге, силясь понять как это работает... едиснтвенное ,что там наверное можно полезного почерпнуть - таблицу формант. -------------------- Блог iDoka.ru CV linkedin.com/in/iDoka Sources github.com/iDoka Never stop thinking...........................

=GM= Просмотр профиля	Mar 15 2007, 00:40 Сообщение #41
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	Цитата(Doka @ Mar 14 2007, 09:52) cпасибо!. еще бы разворот с.198-199 (продолжение П1.2) а вот ИМХО, все же проще по структурной схеме побыстрому в матлабе наваять модельку, чем ковыряться в 20страничном ассемблерном листинге, силясь понять как это работает... единственное, что там наверное можно полезного почерпнуть - таблицу формант. Там меньше 7 страниц кода(:-). Если знаешь, что ваять, тогда проще, само собой разумеется... В общем я подумал-подумал, и копирнул всё приложение 1, пожал малёк, всего 3МБ на 22 страницы. Файл http://nukeuploads.com/download/1173907975...pendix.zip.html Код JEDYRJbcZF9yVRh -------------------- Делай сразу хорошо, плохо само получится

trofim Просмотр профиля	Mar 15 2007, 13:19 Сообщение #42
Группа: Новичок Сообщений: 12 Регистрация: 4-11-04 Пользователь №: 1 039	Не так много, можно и поразбираться, но сначала нужно найти типа библиотеки формант или еще чего подобного. Без этого разбираться смысла нет.

VAHOO Просмотр профиля	Mar 15 2007, 23:01 Сообщение #43
Частый гость Группа: Участник Сообщений: 163 Регистрация: 22-09-05 Пользователь №: 8 834	Вот еще ссылки http://www.imagesco.com/speech/speech-recognition-index.html http://www.talkingelectronics.com/John/Spe...ecognition.html -------------------- Прошивка это душа микроконтроллера!

SasaVitebsk Просмотр профиля	Mar 16 2007, 01:29 Сообщение #44
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Цитата(trofim @ Mar 13 2007, 18:23) 2 SasaVitebsk Синтез речи - задача решаемая. Распознавание - нет. Можно спросить каким образом реализовать простой синтез, даже роботизированный? Я не утверждал, что задача простая. Я написал - решаемая. Объясню почему. В общем случае МК нет необходимости знать что именно он произносит. В этом случае звучание будет не очень, но человек - опознает. В своё время я печатал один документ по DELFI. Меня интересовали потоки. Чтобы уменьшить колличество используемой бумаги я распечатал текст в виде брошуры (с помощью FinePrint) 4 листа на А4 лист. Ну и сижу читаю. Подходит ко мне сын. Долго смотрит, потом спрашивает что ты делаешь? Читаю. Я потом провёл эксперимент. Оказывается он не мог прочесть практически ни одного слова. При сжатии и дальнейшей печати символы исказились почти до неузнаваемости. При этом я прекрасно читал, и не замечал этого! Причина проста. Я понимал, что там написано, - он - нет! Что "скажет" МК - мы поймём даже при сильном искажении, а он будет ошибаться, даже если мы будем по слогам читать. Приведенные ссылки - это не мк. Там описаны мк С ПРОГРАМНЫМ ОБЕСПЕЧЕНИЕМ. Это стоит денег. А самим данные проги не разработать. Ещё раз утверждаю это работа серьёзного коллектива разработчиков на ГОДЫ. Да имеются частные решения для частных случаев. Для сведения: Распознавание речи не имеет ничего общего со сравнением спектров и спектральным анализом. Так только на звук разбитого стекла реагируют. Распознавание речи что-то сродни распознаванию текста (ещё сложнее). Когда распознают букву "А", то её не сравнивают с образцом. Так как имеются различные фонты, есть рукописное написание, при написании может быть разрыв. Поэтому букву преобразуют в набор векторов и работают с векторами. Как не парадоксально, звуки тоже представляют в виде векторов. Дело в том, что буква имеет разный спектр в зависимости от того, где она стоит. (тоже и со слогами) Таким образом необходимо либо сравнивать целые слова либо подходить иначе. Обычно подходят иначе. Как - это вам никто не раскроет. Ещё раз поясняю. Дело не в написании программы. Программу напишет третьекурсник. Дело в громадной исследовательской работе, которую необходимо проделать, чтобы дать задание этому третьекурснику. Данная работа пока не проделана. Но даже когда она будет завершена, - радоваться не стоит. Не следует ждать, что будет выпущен специальный МК. Это должно быть интегрированное решение. МК+набор ПО для распознавания к примеру. И покупая его вы заплатите за МК, за ПО, за лицензию на алгоритм. Этот комплект в настоящий момент будет очень дорог! Так как тысячи предприятий были бы готовы его купить хоть сейчас. Кроме того данная задача требует огромных вычислительных ресурсов и большого объёма оперативной памяти. Я это оцениваю в мегабайты. Я думаю синтез с приемлемым качеством можно реализовать на AVR. Безусловно потребуются внешние элементы. Как минимум дополнительная флэш-память.

CD_Eater Просмотр профиля	Mar 16 2007, 14:01 Сообщение #45
Частый гость Группа: Новичок Сообщений: 173 Регистрация: 3-09-04 Из: Moscow Пользователь №: 595	Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук! Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции).

« Предыдущая тема · AVR · Следующая тема »

5 страниц

< 1 2 3 4 5 >

Reply to this topic

Start new topic

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 19th July 2025 - 09:55

Страница сгенерированна за 0.01492 секунд с 7
ELECTRONIX ©2004-2016