|
синтез голоса |
|
|
|
 |
Ответов
|
Jan 19 2011, 12:28
|
Частый гость
 
Группа: Участник
Сообщений: 161
Регистрация: 9-09-08
Из: РФ
Пользователь №: 40 076

|
Цитата(forever_student @ Jan 19 2011, 13:24)  Реально ли - синтезатор речи (русский язык) на процессоре ~ 100 -150 MIPS и с базой в пределах 8 Мб ? Для стандартов сжатия речи G.723.1, G.729.A одна секунда речи занимает в памяти от 670 до 1000 байт. В обьёме 8 Мб может хранится от 4000 до 12000 слов. Если для Вашего синтезатора речи этого словаря достаточно, то реально.
|
|
|
|
|
Jan 19 2011, 12:41
|
Местный
  
Группа: Участник
Сообщений: 256
Регистрация: 5-04-09
Из: Москва
Пользователь №: 47 180

|
Цитата(=SSN= @ Jan 19 2011, 15:28)  ...Если для Вашего синтезатора речи этого словаря достаточно, то реально. Спасибо, в сторону G.723.1 и G.729.A посмотреть не догадался. Качество, конечно, нужно повыше (насколько я понял, Festival и др. используют 22050Гц/16 бит), но уже понятно, что 100MIPS хватит с большим запасом. А вот что касается словаря... Нужен именно СИНТЕЗАТОР, т.е. текст заранее неизвестен, поэтому ориентироваться на словарь, наверное, неправильно.
|
|
|
|
|
Feb 20 2011, 17:03
|
Местный
  
Группа: Участник
Сообщений: 239
Регистрация: 15-11-09
Из: Санкт-Петербург
Пользователь №: 53 639

|
Цитата(forever_student @ Jan 19 2011, 15:41)  Нужен именно СИНТЕЗАТОР, т.е. текст заранее неизвестен, поэтому ориентироваться на словарь, наверное, неправильно. Если нужен ИМЕННО синтезатор, то здесь выход только один: так называемый "формантный синтезатор", которые часто использовались в доWinдовые времена. Он доходчиво описан в популярной книжке Кейтера "Компьютеры - синтезаторы речи" (я её еще в школе читал  . Берется база слогов (лучше, конечно, фонем, но это вряд ли возможно) далее эти слоги аналогично как в ЛПК-кодерах (тот же G.729 для примера) сегментируются на участки по признаку "гармоники-шум". Далее от озвученных участков берутся только частоты первых трех гармоник. На шумовых участках грубо оценивается спектр (по-сути тот же ЛПК (или АР, как кому нравиться) только с моделью очень низкого порядка). Эти данные и составляют базу. Размер её для русского языка будет смешным: что-то типа 20-30Кбайт. Ну и собственно дальше идет синтез слова по слогам. Если решать эту задачу совсем в лоб, то качество будет "упаси боже". Но, если с умом (имитировать коартикуляцию, переменную длительность слогов, оглушения и т.п.) - качество будет разумным, по-крайней мере, для каких-либо оповещателей.
|
|
|
|
|
Feb 20 2011, 19:08
|
Местный
  
Группа: Участник
Сообщений: 256
Регистрация: 5-04-09
Из: Москва
Пользователь №: 47 180

|
Цитата(Kluwert @ Feb 20 2011, 20:03)  ...Ну и собственно дальше идет синтез слова по слогам... Если бы все так было просто - давно бы уже сделали синтезатор хорошего качества хотя бы для PC. (Я прослушал примеры для Digalo, Festival, Alyona и т.д. Качество меня не устроило+геморрой со словарями и обучением - это нечто  ) Цитата(Kluwert @ Feb 20 2011, 20:03)  ...качество будет разумным, по-крайней мере, для каких-либо оповещателей... Хочется книжки слушать  P.S. За книжку спасибо - поищу обязательно
Сообщение отредактировал forever_student - Feb 20 2011, 19:09
|
|
|
|
Сообщений в этой теме
forever_student синтез голоса Jan 19 2011, 10:24 Methane http://en.wikipedia.org/wiki/Festival_Spee...ynthe... Jan 19 2011, 11:31 forever_student Цитата(Methane @ Jan 19 2011, 14:31) http... Jan 19 2011, 11:59  HARMHARM 4000 слов - это больше словарного запаса школьника... Jan 19 2011, 13:34   Methane Цитата(HARMHARM @ Jan 19 2011, 15:34) 400... Jan 19 2011, 13:37    forever_student Цитата(Methane @ Jan 19 2011, 16:37) Поче... Jan 19 2011, 16:33     Methane Цитата(forever_student @ Jan 19 2011, 18... Jan 19 2011, 17:03      forever_student Цитата(Methane @ Jan 19 2011, 20:03) Каче... Jan 19 2011, 17:25       Methane Цитата(forever_student @ Jan 19 2011, 19... Jan 19 2011, 17:32        forever_student Цитата(Methane @ Jan 19 2011, 20:32) Русс... Jan 19 2011, 17:54         Methane Цитата(forever_student @ Jan 19 2011, 19... Jan 19 2011, 17:58          forever_student Цитата(Methane @ Jan 19 2011, 20:58) Скач... Jan 19 2011, 18:15           sherr Цитата(forever_student @ Jan 19 2011, 21... Jan 19 2011, 18:41            forever_student Цитата(sherr @ Jan 19 2011, 21:41) ...мне... Jan 19 2011, 18:54             timm Цитата(forever_student @ Jan 19 2011, 21... Feb 14 2011, 11:45              forever_student Цитата(timm @ Feb 14 2011, 14:45) ...http... Feb 17 2011, 19:59           Methane Цитата(forever_student @ Jan 19 2011, 20... Jan 19 2011, 18:42         DRUID3 Цитата(forever_student @ Jan 19 2011, 19... Jan 30 2011, 10:33          forever_student Цитата(DRUID3 @ Jan 30 2011, 13:33) Реаль... Jan 30 2011, 11:46           Methane Цитата(forever_student @ Jan 30 2011, 13... Jan 30 2011, 11:53            forever_student Цитата(Methane @ Jan 30 2011, 14:53) ...h... Jan 30 2011, 16:50             Methane Цитата(forever_student @ Jan 30 2011, 18... Jan 30 2011, 17:01              forever_student Цитата(Methane @ Jan 30 2011, 20:01) Блин... Jan 30 2011, 17:07               Methane Цитата(forever_student @ Jan 30 2011, 19... Jan 30 2011, 17:16           DRUID3 Цитата(forever_student @ Jan 30 2011, 13... Jan 30 2011, 12:42 sherr Присоединяюсь, очень нужен открытый проект го... Jan 19 2011, 19:09 forever_student Цитата(sherr @ Jan 19 2011, 22:09) ...еще... Jan 19 2011, 19:33 Cvet-20 Здравствуйте,подскажите чем можно запрограммироват... Feb 10 2011, 12:47
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|