|
|
  |
Речевой кодек для задачи, поставленной GeGel, Приводятся примеры исходного и сжатого речевым кодеком сигнала |
|
|
|
Nov 12 2016, 05:25
|
Частый гость
 
Группа: Участник
Сообщений: 76
Регистрация: 17-05-15
Пользователь №: 86 729

|
Цитата(Mister_DSP @ Nov 11 2016, 13:39)  Ниже выложил пробу звука на 978 бит/с - это тоже что и MELP 1200, только без битов FEC. Средний вариант между 1956 bps и 489 bps. Спасибо, полезно. У Вас в оригинальном файле какая-то предобработка? Вроде бы предварительное эхо? Я его ради интереса пропустил через свой кодек http://exfile.ru/483147Если слушать через динамик, то, как мне кажется, мой вариант предпочтительнее, если же через наушники, то однозначно - МЕLP лучше.
|
|
|
|
|
Nov 12 2016, 19:44
|
Частый гость
 
Группа: Участник
Сообщений: 76
Регистрация: 17-05-15
Пользователь №: 86 729

|
Всё, нет моих сил больше. В файле - последняя версия акустической части, ничего менять не буду. С вокодера, которому передается только нормированный энергетический спектр (без синусной и косинусной компонент), выжать что-нибудь еще невозможно. Пришлось отказаться от полулогарифмического сжатия сигнала, т.к. все эксперты морщили носы, говорили о "советском" звучании и т.п. Впрочем, замечания приму к сведению и буду за них признателен (виртуально, понятное дело).
RESUL.WAV ( 80.08 килобайт )
Кол-во скачиваний: 70
|
|
|
|
|
Nov 12 2016, 21:24
|
Участник

Группа: Участник
Сообщений: 21
Регистрация: 15-10-05
Пользователь №: 9 675

|
Я правильно понял постановку задач. Нужно получить неузнаваемость голоса абонента?
|
|
|
|
|
Nov 12 2016, 21:45
|
Частый гость
 
Группа: Участник
Сообщений: 76
Регистрация: 17-05-15
Пользователь №: 86 729

|
Цитата(z64 @ Nov 12 2016, 22:24)  Я правильно понял постановку задач. Нужно получить неузнаваемость голоса абонента? Нет, разумеется, у меня такой задачи не стоит. Пока только рожал ежика. Смысл родов в том, чтобы ограничиться минимумом информации как передаваемой по каналу связи, так и хранимой в приемном и передающем устройстве. При приемлемом качестве речи (хотя желания потенциальных пользователей в этом плане абсолютно нереалистичны).
|
|
|
|
|
Nov 13 2016, 05:19
|
Частый гость
 
Группа: Участник
Сообщений: 76
Регистрация: 17-05-15
Пользователь №: 86 729

|
Цитата(Mister_DSP @ Nov 13 2016, 05:40)  какой битрейт (максимальный, пик) у последней звуковой пробы? Такой же, не изменился. Для именно этой пробы - 850 без предварительного сжатия и 300 после Хаффмена. Изменил только окно данных в синтезаторе.
|
|
|
|
|
Nov 13 2016, 06:52
|
Частый гость
 
Группа: Участник
Сообщений: 76
Регистрация: 17-05-15
Пользователь №: 86 729

|
Цитата(Mister_DSP @ Nov 13 2016, 07:46)  Какой размер блока в байтах сжимаете Хаффманом? 300 миллисекунд
|
|
|
|
|
Nov 13 2016, 09:20
|
Частый гость
 
Группа: Участник
Сообщений: 76
Регистрация: 17-05-15
Пользователь №: 86 729

|
Цитата(Mister_DSP @ Nov 13 2016, 08:51)  Сможет ли Хаффман пожать блок из 33 байт? Это 6 фреймов вокодера MELP, данные кореллируют между собой (параметры речевого сигнала) Да, в каноническом включении здесь проблемы. Но если представлять последовательность байт в виде ДИКМ, причем невязку корректировать в последующем такте, то все очень недурно получается. Номера передаваемых спектров надо, понятное дело, изначально располагать по частости встречаемости и минимальному ожидаемому приращению на последующем такте. Этот метод мы отработали еще при цифровой передаче ЭКГ через акустический канал мобильника (как говорит ув. GeGel "поверх GSM"). (это лучше нарисовать, т.к. я что-то косноязычно выражаюсь). Для иллюстрации та же запись с разным битрейтом. Это без(!) Хаффмена, просто передаваемые спектры обновляются не при появлении каждой новой "особой точки", а через такт
RESUL400.WAV ( 80.08 килобайт )
Кол-во скачиваний: 74, через два такта, через три, т.е. время обновления спектра становится не приблизительно 10 мсек изначально, а 20...30.. и т.д.
RESUL200.WAV ( 80.08 килобайт )
Кол-во скачиваний: 56
RESUL150.WAV ( 80.08 килобайт )
Кол-во скачиваний: 62
RESUL100.WAV ( 80.08 килобайт )
Кол-во скачиваний: 68Из этих иллюстраций хорошо видно (слышно) как действительно сильно коррелирован речевой сигнал.
Сообщение отредактировал Милливольт - Nov 13 2016, 09:21
|
|
|
|
|
Nov 13 2016, 14:04
|

Частый гость
 
Группа: Участник
Сообщений: 133
Регистрация: 5-11-16
Пользователь №: 94 050

|
При таких крохотных битрейтах вышло великолепно!  Речь на грани разборчивости, зато в узкие каналы пролезет. Единственно в пробе на 100 бит/с фрагменты слов проглатываются - это плохо. А так в целом отлично! Если спектр не обновляется, а только через такт: выходит вы просто дублируете синтез волны при декодировании или как? Я так делал, получается голосовой джиттер. Фрейм у меня 22,5 мс. Пробовал LSP брать через раз - нормально выходит, но если брать через 3 раза, то уже неприемлемо. Мой мод кодека до 381 бит/с ещё можно уменьшить путём загрубления Pitch/Gain/BPV. LSP лучше не трогать. Но качество пострадает, расборчивость на грани.
--------------------
SPY vs. SPY Хорошо там, где нет ничего...
|
|
|
|
|
Nov 14 2016, 17:50
|
Частый гость
 
Группа: Участник
Сообщений: 76
Регистрация: 17-05-15
Пользователь №: 86 729

|
Цитата(Mister_DSP @ Nov 13 2016, 15:04)  Единственно в пробе на 100 бит/с фрагменты слов проглатываются - это плохо. В очередной раз спасибо за ценное замечание. Устранил.
RESUL100.WAV ( 80.08 килобайт )
Кол-во скачиваний: 78Но для стабильного потока без сжатия не получается 100 - только 120. Т.е. 1 раз в 100 мсек передается номер спектра (8 бит) плюс количество повторений в течение этого периода времени (4 бита). Итого 12 бит за 100 мсек, соответственно 120 бит/сек. Звук грубоватый, конечно, не выйдет говорить в итальянском темпе, но для служебной связи, возможно, и будет приемлемо. Вообще, рекорды битрейта - не самоцель. А вот передача поверх GSM должна показать кто есть ху.
Сообщение отредактировал Милливольт - Nov 14 2016, 17:51
|
|
|
|
|
Nov 16 2016, 08:56
|
Частый гость
 
Группа: Участник
Сообщений: 76
Регистрация: 17-05-15
Пользователь №: 86 729

|
Цитата(Mister_DSP @ Nov 16 2016, 06:18)  В итоге только хуже -много пакетов теряется в дальней зоне, а в ближней - с искажениями. У нас при разработке микромощной телеметрии для использования внутри зданий была та же самая история. Ничего из общеупотребительных средств не помогало. Но в итоге проблема решилась успешно. Если это будет уместным, опишу подробно.
|
|
|
|
|
  |
2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)
Пользователей: 0
|
|
|