реклама на сайте
подробности

 
 
5 страниц V  < 1 2 3 4 5 >  
Reply to this topicStart new topic
> Синтезатор речи
VDG
сообщение Mar 12 2007, 23:49
Сообщение #31


Знающий
****

Группа: Участник
Сообщений: 845
Регистрация: 10-02-06
Пользователь №: 14 193



То что есть имеет сильные ограничения. Поэтому области применения очень специализированные, например, военная техника, кое-где требует голосового управления так как руки заняты. Системы автоматизированного call-центра. Но всё в очень жёстких рамках. Причем заточка на английский язык.

Не достигла эта технология того уровня, чтобы её могла "переварить" виндоус.
Велосипед ещё не изобретён. Всё что можно выжать из "фурье" уже выжато, это тупиковый путь. А то как распознаёт живой мозг ещё науке не известно. Даже как улитка раскладывает звук по частотам до сих пор гадают. И прогресса в этой области лет 50 ещё не будет.


--------------------
Go to the top of the page
 
+Quote Post
=GM=
сообщение Mar 13 2007, 00:16
Сообщение #32


Ambidexter
*****

Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282



Цитата(Doka @ Mar 12 2007, 11:45) *
Цитата(=GM= @ Mar 12 2007, 12:51) *
Книга дома, вечером могу выложить, скажите только куда?

можно попробовать залить на новый файловый сервис (кнопка "Загрузить файлы" в верхнем меню, доступ кнему имеют все участники) - потом просто сюда ссылку дадите.

Вроде загрузил, файл: ostapenko.zip, 1827 КБ.


--------------------
Делай сразу хорошо, плохо само получится
Go to the top of the page
 
+Quote Post
Kuzmi4
сообщение Mar 13 2007, 10:01
Сообщение #33


Гуру
******

Группа: Свой
Сообщений: 3 304
Регистрация: 13-02-07
Из: 55°55′5″ 37°52′16″
Пользователь №: 25 329



2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило....
help.gif
Go to the top of the page
 
+Quote Post
=GM=
сообщение Mar 13 2007, 14:45
Сообщение #34


Ambidexter
*****

Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282



Цитата(Kuzmi4 @ Mar 13 2007, 07:01) *
2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило....
help.gif

Первый блин комом, прошу пардону, код дома(:-). Вечером сделаю.


--------------------
Делай сразу хорошо, плохо само получится
Go to the top of the page
 
+Quote Post
trofim
сообщение Mar 13 2007, 17:23
Сообщение #35





Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039



2 SasaVitebsk
Синтез речи - задача решаемая. Распознавание - нет.
[/quote]

Можно спросить каким образом реализовать простой синтез, даже роботизированный?
Go to the top of the page
 
+Quote Post
VDG
сообщение Mar 13 2007, 20:05
Сообщение #36


Знающий
****

Группа: Участник
Сообщений: 845
Регистрация: 10-02-06
Пользователь №: 14 193



Цитата(trofim @ Mar 13 2007, 17:23) *
Можно спросить каким образом реализовать простой синтез, даже роботизированный?

Просто выводите фонемы. Ну а сглаживание перехода между фонемами вещь уже не тривиальная.


--------------------
Go to the top of the page
 
+Quote Post
=GM=
сообщение Mar 13 2007, 23:15
Сообщение #37


Ambidexter
*****

Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282



Цитата(Kuzmi4 @ Mar 13 2007, 07:01) *
2 =GM= - в общем там есть загрузить, но требует какой-то код файла..Имя не покатило....
help.gif

Код такой: YkcpTAm1DFM3SAd,
ссылка http://nukeuploads.com/download/1173816980...apenko.zip.html


--------------------
Делай сразу хорошо, плохо само получится
Go to the top of the page
 
+Quote Post
Kuzmi4
сообщение Mar 14 2007, 10:20
Сообщение #38


Гуру
******

Группа: Свой
Сообщений: 3 304
Регистрация: 13-02-07
Из: 55°55′5″ 37°52′16″
Пользователь №: 25 329



2 =GM= - спасиба..Псмотрел на оглавление - книга страшная smile.gif ...
Тогда до кучи если можно ещё П1.3 -это там где программа синтезатора речи - схемку уже посмотрел, но описание к ней , типа - "...сигнал первой форманты..." - почему то вызывает чувство страха.....
Go to the top of the page
 
+Quote Post
trofim
сообщение Mar 14 2007, 10:39
Сообщение #39





Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039



А где бы можно найти библиотеку фонем?
Go to the top of the page
 
+Quote Post
Doka
сообщение Mar 14 2007, 12:52
Сообщение #40


Electrical Engineer
******

Группа: СуперМодераторы
Сообщений: 2 163
Регистрация: 4-10-04
Пользователь №: 778



Цитата(=GM= @ Mar 13 2007, 23:15) *
Код такой: YkcpTAm1DFM3SAd,
ссылка http://nukeuploads.com/download/1173816980...apenko.zip.html

cпасибо!. еще бы разворот с.198-199 (продолжение П1.2)


Цитата(Kuzmi4 @ Mar 14 2007, 10:20) *
Тогда до кучи если можно ещё П1.3 -это там где программа синтезатора речи - схемку уже посмотрел, но описание к ней , типа - "...сигнал первой форманты..." - почему то вызывает чувство страха.....

а вот ИМХО, всеже проще по структурной схеме побыстрому в матлабе наваять модельку, чем ковыряться в 20страничном ассемблерном листинге, силясь понять как это работает...

едиснтвенное ,что там наверное можно полезного почерпнуть - таблицу формант.


--------------------
Блог iDoka.ru
CV linkedin.com/in/iDoka
Sources github.com/iDoka


Never stop thinking...........................
Go to the top of the page
 
+Quote Post
=GM=
сообщение Mar 15 2007, 00:40
Сообщение #41


Ambidexter
*****

Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282



Цитата(Doka @ Mar 14 2007, 09:52) *
cпасибо!. еще бы разворот с.198-199 (продолжение П1.2)
а вот ИМХО, все же проще по структурной схеме побыстрому в матлабе наваять модельку, чем ковыряться в 20страничном ассемблерном листинге, силясь понять как это работает...

единственное, что там наверное можно полезного почерпнуть - таблицу формант.

Там меньше 7 страниц кода(:-). Если знаешь, что ваять, тогда проще, само собой разумеется...

В общем я подумал-подумал, и копирнул всё приложение 1, пожал малёк, всего 3МБ на 22 страницы.
Файл http://nukeuploads.com/download/1173907975...pendix.zip.html
Код JEDYRJbcZF9yVRh


--------------------
Делай сразу хорошо, плохо само получится
Go to the top of the page
 
+Quote Post
trofim
сообщение Mar 15 2007, 13:19
Сообщение #42





Группа: Новичок
Сообщений: 12
Регистрация: 4-11-04
Пользователь №: 1 039



Не так много, можно и поразбираться, но сначала нужно найти типа библиотеки формант или еще чего подобного. Без этого разбираться смысла нет.
Go to the top of the page
 
+Quote Post
VAHOO
сообщение Mar 15 2007, 23:01
Сообщение #43


Частый гость
**

Группа: Участник
Сообщений: 163
Регистрация: 22-09-05
Пользователь №: 8 834



Вот еще ссылки

http://www.imagesco.com/speech/speech-recognition-index.html
http://www.talkingelectronics.com/John/Spe...ecognition.html


--------------------
Прошивка это душа микроконтроллера!
Go to the top of the page
 
+Quote Post
SasaVitebsk
сообщение Mar 16 2007, 01:29
Сообщение #44


Гуру
******

Группа: Свой
Сообщений: 2 712
Регистрация: 28-11-05
Из: Беларусь, Витебск, Строителей 18-4-220
Пользователь №: 11 521



Цитата(trofim @ Mar 13 2007, 18:23) *
2 SasaVitebsk
Синтез речи - задача решаемая. Распознавание - нет.


Можно спросить каким образом реализовать простой синтез, даже роботизированный?


Я не утверждал, что задача простая. Я написал - решаемая. Объясню почему. В общем случае МК нет необходимости знать что именно он произносит. В этом случае звучание будет не очень, но человек - опознает.

В своё время я печатал один документ по DELFI. Меня интересовали потоки. Чтобы уменьшить колличество используемой бумаги я распечатал текст в виде брошуры (с помощью FinePrint) 4 листа на А4 лист. Ну и сижу читаю. Подходит ко мне сын. Долго смотрит, потом спрашивает что ты делаешь? Читаю. Я потом провёл эксперимент. Оказывается он не мог прочесть практически ни одного слова. При сжатии и дальнейшей печати символы исказились почти до неузнаваемости. При этом я прекрасно читал, и не замечал этого! Причина проста. Я понимал, что там написано, - он - нет!

Что "скажет" МК - мы поймём даже при сильном искажении, а он будет ошибаться, даже если мы будем по слогам читать.




Приведенные ссылки - это не мк. Там описаны мк С ПРОГРАМНЫМ ОБЕСПЕЧЕНИЕМ. Это стоит денег. А самим данные проги не разработать. Ещё раз утверждаю это работа серьёзного коллектива разработчиков на ГОДЫ.

Да имеются частные решения для частных случаев.

Для сведения:
Распознавание речи не имеет ничего общего со сравнением спектров и спектральным анализом. Так только на звук разбитого стекла реагируют. smile.gif Распознавание речи что-то сродни распознаванию текста (ещё сложнее). Когда распознают букву "А", то её не сравнивают с образцом. Так как имеются различные фонты, есть рукописное написание, при написании может быть разрыв. Поэтому букву преобразуют в набор векторов и работают с векторами. Как не парадоксально, звуки тоже представляют в виде векторов. Дело в том, что буква имеет разный спектр в зависимости от того, где она стоит. (тоже и со слогами) Таким образом необходимо либо сравнивать целые слова либо подходить иначе. Обычно подходят иначе. Как - это вам никто не раскроет.


Ещё раз поясняю. Дело не в написании программы. Программу напишет третьекурсник. Дело в громадной исследовательской работе, которую необходимо проделать, чтобы дать задание этому третьекурснику. Данная работа пока не проделана. Но даже когда она будет завершена, - радоваться не стоит. Не следует ждать, что будет выпущен специальный МК. Это должно быть интегрированное решение. МК+набор ПО для распознавания к примеру. И покупая его вы заплатите за МК, за ПО, за лицензию на алгоритм. Этот комплект в настоящий момент будет очень дорог! Так как тысячи предприятий были бы готовы его купить хоть сейчас. Кроме того данная задача требует огромных вычислительных ресурсов и большого объёма оперативной памяти. Я это оцениваю в мегабайты.


Я думаю синтез с приемлемым качеством можно реализовать на AVR. Безусловно потребуются внешние элементы. Как минимум дополнительная флэш-память.
Go to the top of the page
 
+Quote Post
CD_Eater
сообщение Mar 16 2007, 14:01
Сообщение #45


Частый гость
**

Группа: Новичок
Сообщений: 173
Регистрация: 3-09-04
Из: Moscow
Пользователь №: 595



Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук!

Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции).
Go to the top of the page
 
+Quote Post

5 страниц V  < 1 2 3 4 5 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 19th July 2025 - 09:55
Рейтинг@Mail.ru


Страница сгенерированна за 0.01492 секунд с 7
ELECTRONIX ©2004-2016