реклама на сайте
подробности

 
 
> А как насчёт "ручного" VBR?, Или вообще 2 вокодера в одном флаконе?
sigmaN
сообщение Apr 5 2008, 23:25
Сообщение #1


I WANT TO BELIEVE
******

Группа: Свой
Сообщений: 2 617
Регистрация: 9-03-08
Пользователь №: 35 751



Ох опять меня на креатиФФ пАтянуло....

В общем всё тот-же канал на 9600, телефонный разговор....
Ведь одновременно говорят редко, я тут подума, неплохо было-бы динамически менять битрейты в пользу лучшего качества звучания говорящего. Скажем отводить говорящему 7000, а слушающему оставить 2600 чтоб он слово вставить мог..
В общем динамическая оценка загруженности канала и чтоб вокодеры автоматически поджимались, когда траффик становится интенсивнее. Естественно использовать вкупе с VAD, ну и VBR тоже хорошо помогает улучшить качество...

Как считаете, реально что-то подобное заставить хорошо работать?
Что-то мне кажется будут проблемы именно с теми самыми "первыми" словами, которые слушатель будет вставлять во время, когда говорящий ещё говорит.... Да и шум...Хотя с ним не так уж и сложно...
Идея мутная, конечно, но не от хорошей жизни она в голову пришла.
Нужно организовать качественные переговоры, уложившись в те самые 9600....

А достать исходники MELP 4000 видимо нахаляву неудастся:-(
Ох понравилось мне как он звучит!
Мож есть у кого?
Ну или там за разумную цену?


--------------------
The truth is out there...
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
fontp
сообщение Apr 7 2008, 07:33
Сообщение #2


Эксперт
*****

Группа: Свой
Сообщений: 1 467
Регистрация: 25-06-04
Пользователь №: 183



Самый большой "ручной" VBR - это VAD. В телефонном разговоре до 70% это молчание. Но это статистически. Значить реализовать этот потенциал можно только при уплотнении многих каналов. Причём при временном уплотнении речевых каналов реализовать его очень сложно, а при частотном уплотнении - сложно. В большинстве случаев реализовать его удаётся только частично - передавая в паузах риал-тайм голосового потока какие-нибудь не риал-тайм данные, если они есть

"Ручной" VBR идеально реализуется только в СDMA, где если передатчик замолчал - то эффективно освободилась полоса для других абонентов.

Референс код для MELP-е в сети не встречался. Но Вы можете взять референс код для melp и переделать его на 4 кбит посредством более акуратного квантования евойных сущностей.
Получится проприоритарный вокодер с очень хорошим качеством, причём лицензионно и патентно чистый ))) Было очень много учёных публикаций в IEEE как улучшить melp или melp-e
Сделайте себе, назовите его mbe-super-melp-plus :-)
Go to the top of the page
 
+Quote Post
sigmaN
сообщение Apr 8 2008, 11:42
Сообщение #3


I WANT TO BELIEVE
******

Группа: Свой
Сообщений: 2 617
Регистрация: 9-03-08
Пользователь №: 35 751



Цитата(fontp @ Apr 7 2008, 10:33) *
Самый большой "ручной" VBR - это VAD. В телефонном разговоре до 70% это молчание. Но это статистически. Значить реализовать этот потенциал можно только при уплотнении многих каналов. Причём при временном уплотнении речевых каналов реализовать его очень сложно, а при частотном уплотнении - сложно. В большинстве случаев реализовать его удаётся только частично - передавая в паузах риал-тайм голосового потока какие-нибудь не риал-тайм данные, если они есть

"Ручной" VBR идеально реализуется только в СDMA, где если передатчик замолчал - то эффективно освободилась полоса для других абонентов.

Референс код для MELP-е в сети не встречался. Но Вы можете взять референс код для melp и переделать его на 4 кбит посредством более акуратного квантования евойных сущностей.
Получится проприоритарный вокодер с очень хорошим качеством, причём лицензионно и патентно чистый ))) Было очень много учёных публикаций в IEEE как улучшить melp или melp-e
Сделайте себе, назовите его mbe-super-melp-plus :-)

Спасибо.
Я не очень-то силен в теории вокодеров, чтобы вот так вот сходу что-то переделать....но, думаю, это можно сделть.
Просто обычно всё, что ты делаешь впервый раз - получиться не сразу и не очень хорошо )


--------------------
The truth is out there...
Go to the top of the page
 
+Quote Post
fontp
сообщение Apr 8 2008, 12:44
Сообщение #4


Эксперт
*****

Группа: Свой
Сообщений: 1 467
Регистрация: 25-06-04
Пользователь №: 183



Цитата(sigmaN @ Apr 8 2008, 15:42) *
Спасибо.
Я не очень-то силен в теории вокодеров, чтобы вот так вот сходу что-то переделать....но, думаю, это можно сделть.
Просто обычно всё, что ты делаешь впервый раз - получиться не сразу и не очень хорошо )



Есть два способа переделать вокодер в проприетарный. В обоих случаях хорошо бы сначала найти и ознакомиться с литературой - по этой тематике было множество публикаций в IEEE. Просто, чтобы знать куда идти и от каких параметров больше зависит качество. Кстати, ccылки на описание melp-e стандарта на этом форуме приводились и с ним тоже желательно ознакомиться. Но были и ещё более интересные публикации. Стандарт на самом деле всегда является компромиссом

Один способ высоконаучный, но не очень практичный. Состоит в том, чтобы новое число бит попытаться распределить оптимально, построив новые книги кодирования, новые векторные квантователи и т.д. Даже изменяя структуру VQ-квантователей.
Но для этого нужно во-первых располагать значительными массивами реальной речи - речевыми банками данных (они существуют только для английской речи и стоят больших денег). Поэтому лучше создать тогда такие самому - записывая, например, болтовню с радиостанций. Во-вторых, нужно осваивать оптимизационную технику векторного квантования. Обычно используют для оптимизации своих таблиц векторного квантования LBG-алгоритм векторного квантования. Его можно найти готовый в Матлабе в Coding Toolbox или вообще в сети. Linde-Buzo-Grey векторного квантования - это по существу оптимизационная процедура кластерного анализа. Если это не ваша специальность, то всё это Вам скорее всего не нужно.

Второй способ, антинаучный, но практичный. Начитавшись статеек в IEEE, простыми переборными экспериментами сначала нужно выяснить от размера каких таблиц больше зависит качество звука. Именно эти таблицы Вы будете увеличивать в двое (линейной интерполяцией промежуточных уровней) добавляя к квантователю данного параметра 1 бит. Т.е. если мы не умеем строить таблицы квантования сами, мы вынуждены тупо добавлять к ним по одному биту, никак не меняя их структуру. Но это сделать достаточно просто. Более того управляя этим кол-вом бит можно сделать свой вокодер при желании VBR
Go to the top of the page
 
+Quote Post
sigmaN
сообщение Apr 8 2008, 13:23
Сообщение #5


I WANT TO BELIEVE
******

Группа: Свой
Сообщений: 2 617
Регистрация: 9-03-08
Пользователь №: 35 751



Цитата(fontp @ Apr 8 2008, 15:44) *
Есть два способа переделать вокодер в проприетарный. В обоих случаях хорошо бы сначала найти и ознакомиться с литературой - по этой тематике было множество публикаций в IEEE. Но были и ещё более интересные публикации.

Хорошо. А что за более интересные публикации??
Мне они стали более интересными, чем IEEE )
Цитата(fontp @ Apr 8 2008, 15:44) *
Один способ высоконаучный, но не очень практичный.

Ну это потом моежт быть как-то испробую :-)
Про радио интересная идея. Только они под музыку часто болтают....
Ну а если обойти модные FM станции и найти что-нибудь попроще - идея сильна!
Цитата(fontp @ Apr 8 2008, 15:44) *
Второй способ, антинаучный, но практичный.

Вот это да! Вот это по нашему )
Помогите ещё, пожалуйста, найти статейки IEEE, я там вконец запутался - там столько всего.
Может быть у вас осталось пару ссылок или номера доков....
Я думаю этот антинаучный метод освоить не составит больших проблем и меня это очень заинтересовало.

И ещё какую-нибудь книжицу бы толковую по вокодерам вообще.... было-бы легче разобраться.

Спасибо за помощь!


--------------------
The truth is out there...
Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 16th August 2025 - 22:47
Рейтинг@Mail.ru


Страница сгенерированна за 0.01413 секунд с 7
ELECTRONIX ©2004-2016