А как насчёт "ручного" VBR? - Форум разработчиков электроники ELECTRONIX.ru

А как насчёт "ручного" VBR?, Или вообще 2 вокодера в одном флаконе?

sigmaN Просмотр профиля	Apr 5 2008, 23:25 Сообщение #1
I WANT TO BELIEVE Группа: Свой Сообщений: 2 617 Регистрация: 9-03-08 Пользователь №: 35 751	Ох опять меня на креатиФФ пАтянуло.... В общем всё тот-же канал на 9600, телефонный разговор.... Ведь одновременно говорят редко, я тут подума, неплохо было-бы динамически менять битрейты в пользу лучшего качества звучания говорящего. Скажем отводить говорящему 7000, а слушающему оставить 2600 чтоб он слово вставить мог.. В общем динамическая оценка загруженности канала и чтоб вокодеры автоматически поджимались, когда траффик становится интенсивнее. Естественно использовать вкупе с VAD, ну и VBR тоже хорошо помогает улучшить качество... Как считаете, реально что-то подобное заставить хорошо работать? Что-то мне кажется будут проблемы именно с теми самыми "первыми" словами, которые слушатель будет вставлять во время, когда говорящий ещё говорит.... Да и шум...Хотя с ним не так уж и сложно... Идея мутная, конечно, но не от хорошей жизни она в голову пришла. Нужно организовать качественные переговоры, уложившись в те самые 9600.... А достать исходники MELP 4000 видимо нахаляву неудастся:-( Ох понравилось мне как он звучит! Мож есть у кого? Ну или там за разумную цену? -------------------- The truth is out there...

Ответов

fontp Просмотр профиля	Apr 7 2008, 07:33 Сообщение #2
Эксперт Группа: Свой Сообщений: 1 467 Регистрация: 25-06-04 Пользователь №: 183	Самый большой "ручной" VBR - это VAD. В телефонном разговоре до 70% это молчание. Но это статистически. Значить реализовать этот потенциал можно только при уплотнении многих каналов. Причём при временном уплотнении речевых каналов реализовать его очень сложно, а при частотном уплотнении - сложно. В большинстве случаев реализовать его удаётся только частично - передавая в паузах риал-тайм голосового потока какие-нибудь не риал-тайм данные, если они есть "Ручной" VBR идеально реализуется только в СDMA, где если передатчик замолчал - то эффективно освободилась полоса для других абонентов. Референс код для MELP-е в сети не встречался. Но Вы можете взять референс код для melp и переделать его на 4 кбит посредством более акуратного квантования евойных сущностей. Получится проприоритарный вокодер с очень хорошим качеством, причём лицензионно и патентно чистый ))) Было очень много учёных публикаций в IEEE как улучшить melp или melp-e Сделайте себе, назовите его mbe-super-melp-plus :-)

sigmaN Просмотр профиля	Apr 8 2008, 11:42 Сообщение #3
I WANT TO BELIEVE Группа: Свой Сообщений: 2 617 Регистрация: 9-03-08 Пользователь №: 35 751	Цитата(fontp @ Apr 7 2008, 10:33) Самый большой "ручной" VBR - это VAD. В телефонном разговоре до 70% это молчание. Но это статистически. Значить реализовать этот потенциал можно только при уплотнении многих каналов. Причём при временном уплотнении речевых каналов реализовать его очень сложно, а при частотном уплотнении - сложно. В большинстве случаев реализовать его удаётся только частично - передавая в паузах риал-тайм голосового потока какие-нибудь не риал-тайм данные, если они есть "Ручной" VBR идеально реализуется только в СDMA, где если передатчик замолчал - то эффективно освободилась полоса для других абонентов. Референс код для MELP-е в сети не встречался. Но Вы можете взять референс код для melp и переделать его на 4 кбит посредством более акуратного квантования евойных сущностей. Получится проприоритарный вокодер с очень хорошим качеством, причём лицензионно и патентно чистый ))) Было очень много учёных публикаций в IEEE как улучшить melp или melp-e Сделайте себе, назовите его mbe-super-melp-plus :-) Спасибо. Я не очень-то силен в теории вокодеров, чтобы вот так вот сходу что-то переделать....но, думаю, это можно сделть. Просто обычно всё, что ты делаешь впервый раз - получиться не сразу и не очень хорошо ) -------------------- The truth is out there...

fontp Просмотр профиля	Apr 8 2008, 12:44 Сообщение #4
Эксперт Группа: Свой Сообщений: 1 467 Регистрация: 25-06-04 Пользователь №: 183	Цитата(sigmaN @ Apr 8 2008, 15:42) Спасибо. Я не очень-то силен в теории вокодеров, чтобы вот так вот сходу что-то переделать....но, думаю, это можно сделть. Просто обычно всё, что ты делаешь впервый раз - получиться не сразу и не очень хорошо ) Есть два способа переделать вокодер в проприетарный. В обоих случаях хорошо бы сначала найти и ознакомиться с литературой - по этой тематике было множество публикаций в IEEE. Просто, чтобы знать куда идти и от каких параметров больше зависит качество. Кстати, ccылки на описание melp-e стандарта на этом форуме приводились и с ним тоже желательно ознакомиться. Но были и ещё более интересные публикации. Стандарт на самом деле всегда является компромиссом Один способ высоконаучный, но не очень практичный. Состоит в том, чтобы новое число бит попытаться распределить оптимально, построив новые книги кодирования, новые векторные квантователи и т.д. Даже изменяя структуру VQ-квантователей. Но для этого нужно во-первых располагать значительными массивами реальной речи - речевыми банками данных (они существуют только для английской речи и стоят больших денег). Поэтому лучше создать тогда такие самому - записывая, например, болтовню с радиостанций. Во-вторых, нужно осваивать оптимизационную технику векторного квантования. Обычно используют для оптимизации своих таблиц векторного квантования LBG-алгоритм векторного квантования. Его можно найти готовый в Матлабе в Coding Toolbox или вообще в сети. Linde-Buzo-Grey векторного квантования - это по существу оптимизационная процедура кластерного анализа. Если это не ваша специальность, то всё это Вам скорее всего не нужно. Второй способ, антинаучный, но практичный. Начитавшись статеек в IEEE, простыми переборными экспериментами сначала нужно выяснить от размера каких таблиц больше зависит качество звука. Именно эти таблицы Вы будете увеличивать в двое (линейной интерполяцией промежуточных уровней) добавляя к квантователю данного параметра 1 бит. Т.е. если мы не умеем строить таблицы квантования сами, мы вынуждены тупо добавлять к ним по одному биту, никак не меняя их структуру. Но это сделать достаточно просто. Более того управляя этим кол-вом бит можно сделать свой вокодер при желании VBR

sigmaN Просмотр профиля	Apr 8 2008, 13:23 Сообщение #5
I WANT TO BELIEVE Группа: Свой Сообщений: 2 617 Регистрация: 9-03-08 Пользователь №: 35 751	Цитата(fontp @ Apr 8 2008, 15:44) Есть два способа переделать вокодер в проприетарный. В обоих случаях хорошо бы сначала найти и ознакомиться с литературой - по этой тематике было множество публикаций в IEEE. Но были и ещё более интересные публикации. Хорошо. А что за более интересные публикации?? Мне они стали более интересными, чем IEEE ) Цитата(fontp @ Apr 8 2008, 15:44) Один способ высоконаучный, но не очень практичный. Ну это потом моежт быть как-то испробую :-) Про радио интересная идея. Только они под музыку часто болтают.... Ну а если обойти модные FM станции и найти что-нибудь попроще - идея сильна! Цитата(fontp @ Apr 8 2008, 15:44) Второй способ, антинаучный, но практичный. Вот это да! Вот это по нашему ) Помогите ещё, пожалуйста, найти статейки IEEE, я там вконец запутался - там столько всего. Может быть у вас осталось пару ссылок или номера доков.... Я думаю этот антинаучный метод освоить не составит больших проблем и меня это очень заинтересовало. И ещё какую-нибудь книжицу бы толковую по вокодерам вообще.... было-бы легче разобраться. Спасибо за помощь! -------------------- The truth is out there...

Сообщений в этой теме

sigmaN А как насчёт "ручного" VBR? Apr 5 2008, 23:25

DRUID3 Цитата(sigmaN @ Apr 6 2008, 02:25) Ох опя... Apr 6 2008, 08:45

sigmaN Канал как канал, никакой он не дуплекс, а может 96... Apr 6 2008, 09:47

fontp Самый большой "ручной" VBR - это VAD. В ... Apr 7 2008, 07:33

sigmaN Цитата(fontp @ Apr 7 2008, 10:33) Самый б... Apr 8 2008, 11:42

fontp Цитата(sigmaN @ Apr 8 2008, 15:42) Спасиб... Apr 8 2008, 12:44

sigmaN Цитата(fontp @ Apr 8 2008, 15:44) Есть дв... Apr 8 2008, 13:23

« Предыдущая тема · Алгоритмы ЦОС (DSP) · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0