|
|
  |
А как насчёт "ручного" VBR?, Или вообще 2 вокодера в одном флаконе? |
|
|
|
Apr 5 2008, 23:25
|

I WANT TO BELIEVE
     
Группа: Свой
Сообщений: 2 617
Регистрация: 9-03-08
Пользователь №: 35 751

|
Ох опять меня на креатиФФ пАтянуло....
В общем всё тот-же канал на 9600, телефонный разговор.... Ведь одновременно говорят редко, я тут подума, неплохо было-бы динамически менять битрейты в пользу лучшего качества звучания говорящего. Скажем отводить говорящему 7000, а слушающему оставить 2600 чтоб он слово вставить мог.. В общем динамическая оценка загруженности канала и чтоб вокодеры автоматически поджимались, когда траффик становится интенсивнее. Естественно использовать вкупе с VAD, ну и VBR тоже хорошо помогает улучшить качество...
Как считаете, реально что-то подобное заставить хорошо работать? Что-то мне кажется будут проблемы именно с теми самыми "первыми" словами, которые слушатель будет вставлять во время, когда говорящий ещё говорит.... Да и шум...Хотя с ним не так уж и сложно... Идея мутная, конечно, но не от хорошей жизни она в голову пришла. Нужно организовать качественные переговоры, уложившись в те самые 9600....
А достать исходники MELP 4000 видимо нахаляву неудастся:-( Ох понравилось мне как он звучит! Мож есть у кого? Ну или там за разумную цену?
--------------------
The truth is out there...
|
|
|
|
|
Apr 6 2008, 08:45
|

山伏
    
Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294

|
Цитата(sigmaN @ Apr 6 2008, 02:25)  Ох опять меня на креатиФФ пАтянуло....
В общем всё тот-же канал на 9600, телефонный разговор.... Ведь одновременно говорят редко, я тут подума, неплохо было-бы динамически менять битрейты в пользу лучшего качества звучания говорящего. Скажем отводить говорящему 7000, а слушающему оставить 2600 чтоб он слово вставить мог.. В общем динамическая оценка загруженности канала и чтоб вокодеры автоматически поджимались, когда траффик становится интенсивнее. Естественно использовать вкупе с VAD, ну и VBR тоже хорошо помогает улучшить качество...
Как считаете, реально что-то подобное заставить хорошо работать? Что-то мне кажется будут проблемы именно с теми самыми "первыми" словами, которые слушатель будет вставлять во время, когда говорящий ещё говорит.... Да и шум...Хотя с ним не так уж и сложно... Идея мутная, конечно, но не от хорошей жизни она в голову пришла. Нужно организовать качественные переговоры, уложившись в те самые 9600....
А достать исходники MELP 4000 видимо нахаляву неудастся:-( Ох понравилось мне как он звучит! Мож есть у кого? Ну или там за разумную цену? Непонятна само предназначение идеи. Что к Вас за канал 9600 на дуплекс? Т.е. один канал отхватывает от битрейта другого? Мне кажется намного эффективнее со стороны разговора будет VOXом рвать передачу одного из собеседников если слова вставляет другой. Такое наблюдал при работе связных систем на КВ, как любительских так и профессиональных. И ничего, отличный, связный разговор. А так только хуже собеседник что-то переспрашивает с отвратительным качествам сам теряя качество того что слушает и т.д. - "моя твоя непонимэ". Думаю, не лучшее решение... Да и что это за аппаратура такая что использует канал 9600 позволяя одновременно разбивать часть битрейта на каналы? MELP - просто его его исходники стибрить думаю не так и сложно. Но будут проблемы если надо сертифицировать тот или иной продукт, да и с патентным правом могут быть осложнения.
--------------------
Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...
|
|
|
|
|
Apr 6 2008, 09:47
|

I WANT TO BELIEVE
     
Группа: Свой
Сообщений: 2 617
Регистрация: 9-03-08
Пользователь №: 35 751

|
Канал как канал, никакой он не дуплекс, а может 9600 либо только в ту, либо только в другую сторону(GSM data call).
Предназначение идеи - улучшить качество(в целом) ну или одна из идей как это сделать на данным канале с данным вокодером )
Часть битрейта не разбивается на каналы, идея состоит в том, чтобы поставить эдакий спидометр на канал, который бы смотрел с какой скоростью сейчас идет обмен и правил бы битрейт вокодера(в меньшую сторону, если скорость на прием увеличивается). Т.е таким способом определялось бы, что собеседник вставляет слово, а передатчику следует чуточку попуститься.... Аналогично со скоростью на передачу...
То, что шаманский метод - это ясно...но идея возникла, почему бы не услышать мнение более опытных людей)
Да, а насчет MELP 4000, что-то я себе слабо представляю как можно стыбрить исходники.... Сервак что-ли их хакнуть :-) Не факт что они у них вообще на серваке лежат :-D
--------------------
The truth is out there...
|
|
|
|
|
Apr 8 2008, 11:42
|

I WANT TO BELIEVE
     
Группа: Свой
Сообщений: 2 617
Регистрация: 9-03-08
Пользователь №: 35 751

|
Цитата(fontp @ Apr 7 2008, 10:33)  Самый большой "ручной" VBR - это VAD. В телефонном разговоре до 70% это молчание. Но это статистически. Значить реализовать этот потенциал можно только при уплотнении многих каналов. Причём при временном уплотнении речевых каналов реализовать его очень сложно, а при частотном уплотнении - сложно. В большинстве случаев реализовать его удаётся только частично - передавая в паузах риал-тайм голосового потока какие-нибудь не риал-тайм данные, если они есть
"Ручной" VBR идеально реализуется только в СDMA, где если передатчик замолчал - то эффективно освободилась полоса для других абонентов.
Референс код для MELP-е в сети не встречался. Но Вы можете взять референс код для melp и переделать его на 4 кбит посредством более акуратного квантования евойных сущностей. Получится проприоритарный вокодер с очень хорошим качеством, причём лицензионно и патентно чистый ))) Было очень много учёных публикаций в IEEE как улучшить melp или melp-e Сделайте себе, назовите его mbe-super-melp-plus :-) Спасибо. Я не очень-то силен в теории вокодеров, чтобы вот так вот сходу что-то переделать....но, думаю, это можно сделть. Просто обычно всё, что ты делаешь впервый раз - получиться не сразу и не очень хорошо )
--------------------
The truth is out there...
|
|
|
|
|
Apr 8 2008, 12:44
|

Эксперт
    
Группа: Свой
Сообщений: 1 467
Регистрация: 25-06-04
Пользователь №: 183

|
Цитата(sigmaN @ Apr 8 2008, 15:42)  Спасибо. Я не очень-то силен в теории вокодеров, чтобы вот так вот сходу что-то переделать....но, думаю, это можно сделть. Просто обычно всё, что ты делаешь впервый раз - получиться не сразу и не очень хорошо ) Есть два способа переделать вокодер в проприетарный. В обоих случаях хорошо бы сначала найти и ознакомиться с литературой - по этой тематике было множество публикаций в IEEE. Просто, чтобы знать куда идти и от каких параметров больше зависит качество. Кстати, ccылки на описание melp-e стандарта на этом форуме приводились и с ним тоже желательно ознакомиться. Но были и ещё более интересные публикации. Стандарт на самом деле всегда является компромиссом Один способ высоконаучный, но не очень практичный. Состоит в том, чтобы новое число бит попытаться распределить оптимально, построив новые книги кодирования, новые векторные квантователи и т.д. Даже изменяя структуру VQ-квантователей. Но для этого нужно во-первых располагать значительными массивами реальной речи - речевыми банками данных (они существуют только для английской речи и стоят больших денег). Поэтому лучше создать тогда такие самому - записывая, например, болтовню с радиостанций. Во-вторых, нужно осваивать оптимизационную технику векторного квантования. Обычно используют для оптимизации своих таблиц векторного квантования LBG-алгоритм векторного квантования. Его можно найти готовый в Матлабе в Coding Toolbox или вообще в сети. Linde-Buzo-Grey векторного квантования - это по существу оптимизационная процедура кластерного анализа. Если это не ваша специальность, то всё это Вам скорее всего не нужно. Второй способ, антинаучный, но практичный. Начитавшись статеек в IEEE, простыми переборными экспериментами сначала нужно выяснить от размера каких таблиц больше зависит качество звука. Именно эти таблицы Вы будете увеличивать в двое (линейной интерполяцией промежуточных уровней) добавляя к квантователю данного параметра 1 бит. Т.е. если мы не умеем строить таблицы квантования сами, мы вынуждены тупо добавлять к ним по одному биту, никак не меняя их структуру. Но это сделать достаточно просто. Более того управляя этим кол-вом бит можно сделать свой вокодер при желании VBR
|
|
|
|
|
Apr 8 2008, 13:23
|

I WANT TO BELIEVE
     
Группа: Свой
Сообщений: 2 617
Регистрация: 9-03-08
Пользователь №: 35 751

|
Цитата(fontp @ Apr 8 2008, 15:44)  Есть два способа переделать вокодер в проприетарный. В обоих случаях хорошо бы сначала найти и ознакомиться с литературой - по этой тематике было множество публикаций в IEEE. Но были и ещё более интересные публикации. Хорошо. А что за более интересные публикации?? Мне они стали более интересными, чем IEEE ) Цитата(fontp @ Apr 8 2008, 15:44)  Один способ высоконаучный, но не очень практичный. Ну это потом моежт быть как-то испробую :-) Про радио интересная идея. Только они под музыку часто болтают.... Ну а если обойти модные FM станции и найти что-нибудь попроще - идея сильна! Цитата(fontp @ Apr 8 2008, 15:44)  Второй способ, антинаучный, но практичный. Вот это да! Вот это по нашему ) Помогите ещё, пожалуйста, найти статейки IEEE, я там вконец запутался - там столько всего. Может быть у вас осталось пару ссылок или номера доков.... Я думаю этот антинаучный метод освоить не составит больших проблем и меня это очень заинтересовало. И ещё какую-нибудь книжицу бы толковую по вокодерам вообще.... было-бы легче разобраться. Спасибо за помощь!
--------------------
The truth is out there...
|
|
|
|
|
  |
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|