Форум разработчиков электроники ELECTRONIX.ru

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: передача речи

Форум разработчиков электроники ELECTRONIX.ru > Цифровая обработка сигналов - ЦОС (DSP) > Алгоритмы ЦОС (DSP)

shf_05

Oct 17 2008, 10:05

требуется передавать различимую речь в диапазоне частот < 2кГц, передача методом ОБП.
вопрос
1. какой диапазон из 20-20000Гц лучше передавать,
2. каким фильтром лучше выделять (КИХ или БИХ)- те важны ли для кач-ва речи фазовые искажения (вроде как нет)?
смоделил бы в матлабе, да звуковухи щас нет под рукой- негде потестить, а писать на ДСП вроде как лучше что-то боле менее осмысленное.- подскажите нужное направление.

DRUID3

Oct 17 2008, 10:30

Цитата(shf_05 @ Oct 17 2008, 13:05)

требуется передавать различимую речь в диапазоне частот < 2кГц, передача методом ОБП.
вопрос
1. какой диапазон из 20-20000Гц лучше передавать

Очень бы хотелось знать - а понимает ли сам автор что спрашивает? Если да то, что я думаю то отсылать к журналу "юный техник" уже поздно... наверное WiKi будет в самый раз...

Цитата(shf_05 @ Oct 17 2008, 13:05)

2. каким фильтром лучше выделять (КИХ или БИХ)- те важны ли для кач-ва речи фазовые искажения (вроде как нет)?

Для качества речи - да, важны любые искажения, но для качества достаточного для телефонной связи - малозначительны. Со спокойным сердцем можно юзать IIR.

Цитата(shf_05 @ Oct 17 2008, 13:05)

смоделил бы в матлабе, да звуковухи щас нет под рукой- негде потестить,

(сам себе)Все ругают Win а ведь есть пакеты и пострашнее

... И намного.

Цитата(shf_05 @ Oct 17 2008, 13:05)

а писать на ДСП вроде как лучше что-то боле менее осмысленное.

Да уш... Золотые слова.

shf_05

Oct 17 2008, 11:29

я отлично понимаю, что сказал)
ну не занимался я передачей-обработкой речи, не вижу в этом ничего плохого.
к юному технику отсылать не надо, лучше скажите в какой области зв. частот сосредоточена речь.

HardJoker

Oct 17 2008, 11:46

Цитата(shf_05 @ Oct 17 2008, 15:29)

Если помоможет, для каналов ТфОП (они же абонентские окончания) диапазон 300Hz...3400Hz, приказ N43 от 15.04.96 "Об утверждении Норм на электрические параметры каналов тональной частоты магистральной и внутризоновых первичных сетей", МИНИСТЕРСТВО СВЯЗИ РОССИЙСКОЙ ФЕДЕРАЦИИ

shf_05

Oct 17 2008, 11:49

спасибо, а если применить командирование по альфа или ню закону С/Ш улучшится?

DRUID3

Oct 17 2008, 11:59

Цитата(shf_05 @ Oct 17 2008, 14:29)

300-3600 Hz. Стандарт. Частоту дискретизации берут 8000 Hz для телефонного канала.

Но если это для "сумасшедших экспериментов" то можно попытаться и гораздо уже 500-1500 тоже можно будет что-то разобрать. Еще к размышлению - если взять большую выборку и накапливать, то получим картину распределения мощности по частотному спектру для телефонных разговоров близкую к участку функции (1/F). Но мощность-мощностью, а характеристика слуха ей не соответствует...

Цитата(shf_05 @ Oct 17 2008, 14:49)

спасибо, а если применить командирование(!?) по альфа или ню закону С/Ш улучшится?

В смысле компрессию? конечно нет! Компрессия уменьшает количество бит при передаче одного звукового отсчета - а за все в жизни нужно платить... Иными словами звук "загрубляется" отсюда и уменьшение С/Ш. Но о каком улучшении вообще речь? Лучше чем в оригинале!?

=GM=

Oct 17 2008, 12:40

В телефонии принято работать с полосой 300-3400 Гц, общественная практика показывает, что распознаваемость речи в такой полосе практически достаточна. Если сужать полосу, то распознаваемость ухудшится, насколько - трудно сказать, зависит от применения.

Ссылка отсюда http://en.wikipedia.org/wiki/Vocal_range
In terms of frequency, human voices are roughly in the range of 80 Hz to 1100 Hz (that is, E2 to C6) for normal male and female voices together.

Maverick

Oct 17 2008, 12:53

Посмотрите это может поможет

INT1

Oct 17 2008, 13:45

Вобще то в аналоговой радиотелефонии, а особенно в ОБП(SSB) если я правильно расшифровал аббревиатуру, динамический диапазон сжимают, -для улучшения энергетиики(использования мощности) передатчика. Применяются два способа, по отделности, или в комбинации:
- сжате динамического диапазона (пик -фактора) по среднему уровню сигнала по типу медленного АРУ;
- амплитудное ограничение ("клиппирование");
У каждого из способов свои преимущества и недостатки.
Почему то вспомнилась старинная книга

, вот из нее пара страниц (djvu):

DRUID3

Oct 17 2008, 14:06

Цитата(INT1 @ Oct 17 2008, 16:45)

, вот из нее пара страниц (djvu):

ага, т.е. стремятся убрать(уменьшить) амплитудную составляющую и фактически выродить SSB в PhM. Но аналоговое ограничение и цифровое компандирование применяются для абсолютно разных целей хоть и имеют сходную "математическую подоплеку". Уменьшив число бит в цифровом сигнале мы необратимо теряем его часть(вот уже и шум). Компрессия же аналогового голосового SSB канала опиралась на тот факт, что такие предыскажения не делают заметных ухудшений восприятия голоса(это из области психологии и физиологии) что совершенно не так для любого автоматического детектора.
Если посидеть и вдуматься то понятно, что в аналоговой линии биты не терялись они "приуменьшались"

INT1

Oct 17 2008, 14:34

Ну, я исхожу из того, что в радиотелефонной связи основной задачей является донесение смысловой информации сообщеня с минимальными потарями и затратами (частотного ресурса в частноти), а не тембровых окрасок голоса или оттенков настроения оператора(ши).В таком ключе можно двинуться дальше, -Вас МП3 устраивает?, -но это уже отклонение от темы

.
ЗЫ, как бы замечание, аналоговый сигнал -это уже SSB, только с "нулевой несущей" . Термин ОБП появляется, когда возникает вопрос его "доставки" адресату, т.е. перенос его спектра в область радиочастот.
Отсюда, при использовании радиоканала и реализации его максимальной эффективности стремятся:
- максимально возможно сузить спектр и тем самым увеличить с/ш ;
- максимально использовать мощность передатчика, т.е. понизить пикфактор речи

shf_05

Oct 17 2008, 15:53

моя задача довольно проста- передать различимую речь в пределах полосы передаваемого с-ла 2кГц, целью сужения полосы является не получение СШ, а ограничения в полосе перед. с-ла- эдакий "плохой телефонный канал".
про компандирование я понимаю, что инф-я теряется при сжатии, надеялся. что при нелинейном преобразовании улучшится соотношение СШ (при его передаче по зашум. каналу.) для маленьких уровней с-ла- ведь он усиляется больше, чем при линейном или я что-то путаю (помню что-то такое из маг. записи звука)?
алгорим сжатия речи, (если будет применен) желательно нетребовательный к ресурсам- проц у меня adsp2191 и то занят др. задачами на 70%.

PS: сделал полосу 300-1500 ф-м КИХ 33-го (Fs=8000) порядка, преобр. г-та 30-го пор. на КИХ ф-ре, проверил- впечатление, что собеседник с насморком, но речь понятна).

жду дальнейших предложений по улучшению кач-ва, буду благодарен за помощь.

Цитата(INT1 @ Oct 17 2008, 19:45)

Почему то вспомнилась старинная книга

, вот из нее пара страниц (djvu):

можно ссылку на книгу или ее название, пжста?

INT1

Oct 17 2008, 16:58

В сети книги нет. Вот залил, и приатачил аннотацию. Конечно, она больше интересна в историческом плане, но написана корифеями от радиоэлектроники. Хотя, как знать, все новое- это давно забытое старое, да и уравнения Максвелла и правило буравчика с тех пор- не изменились

http://narod.ru/disk/3248780000/Dict.rar.html

Огурцов

Oct 17 2008, 17:25

Поскольку все равно предполагается цифра, я бы попробовал использовать кодек типа MC145481 (мне понравились). Это ацп+фильтр+компрессор(по сути). А при передаче полученный код выводить на 8ми битный цап, как будто он линейный. Смоделировать и послушать что получится можно обработав любой подходящий wav-файл.

INT1

Oct 19 2008, 04:42

Если предполагается цифра в канале связи, то даже используя готовые аппаратные кодеки в 2кГц никак не влезть.
Если цифра в канале обработки аналогового сигнала, то фильтрация
и вырезание формант ( как например предлагается в тех древних страничках), в 2кГц возможно и позволит упаковать. Ну а дальше ОБП. Так шта как говорится, тут- ДСП Вам в руки .

DRUID3

Oct 19 2008, 05:09

Цитата(INT1 @ Oct 19 2008, 07:42)

Если предполагается цифра в канале связи, то даже используя готовые аппаратные кодеки в 2кГц никак не влезть.

...готовые - нет, но самому собрать MELP можно

, там в 600 бит в секунду реально "влезть" а поскольку "боды бывают разные" то реально передавать речь в канале в сотю другую герц...

Но я так понял автору njgbrf нужно не это, ему нужно SSB...

INT1

Oct 19 2008, 09:09

Так и я так понял. В современных трансиверах DSP управляются с этими делами, даже на низких ПЧ. Icom полюбляет их, да и Kenwood с Yaesu -тоже. Вот любительский самопал с ЦСП:
http://t03dsp.skydan.in.ua/Overview_ru.htm
Если запихать цифру в радиоканальные 2кГц, то качество связи при прочих равных реальных условиях будет однозначно хуже чем у обычных 2кГц аналоговых SSB.

shf_05

Oct 19 2008, 16:35

сейчас поток речи идет с кодека ad1885, заходит в ДСП, там фильтруется, получаются квадратуры, далее модулируется в ad9856, передается в к-л связи, на приеме переносится снова на ноль, фильтруется и на вых. поток кодека.
цифр. передачу городить как-то не очень хочется- это уже модем получается..., хотя если это даст большой выигрыш в кач-ве (и/или помехоустойчивости) как вариант дальнейщего развития пойдет.

можно ли как-то предисказить речевой сигнал, чтобы что-то полезное из этого получить?

blackfin

Oct 19 2008, 17:22

Цитата(shf_05 @ Oct 19 2008, 20:35)

можно ли как-то предисказить речевой сигнал, чтобы что-то полезное из этого получить?

Можно много чего использовать, например, A-law или μ-law компандер из Recommendation G.711.

shf_05

Oct 20 2008, 04:40

это может быть применено к аналоговым системам передачи (как ОБП) или только для цифры?
и что это может дать для ОБП?

DRUID3

Oct 20 2008, 19:31

Цитата(INT1 @ Oct 19 2008, 12:09)

Если запихать цифру в радиоканальные 2кГц, то качество связи при прочих равных реальных условиях будет однозначно хуже чем у обычных 2кГц аналоговых SSB.

не вводіть початківців в оману!

сейчас вся профессиональная техника обработки звука - цифровая. И никто не жалуется

.
Ну а уж для КВ связи того качества более чем достаточно.
Мало того, MELP-600 звучит достаточно качественно для служебной телефонной связи (невпремер лучше многих служебных SSBшек) и если его "вложить" в любой код исправляющий ошибки(а лучше одинаково не коррелируемый как с гармоническими сигналами так и широкополосным шумом) то в 3-х kHz отведенных под SSB можно получить намного более качественный канал связи чем этот аналоговый пережиток. Причем он одновременно будет и модемом, т.е. данные передавать.
Именно так и делают во всяких Харрисах и Маркони для КВ военной связи("аналоговый" SSBтам тоже оставлен для совместимости с аппаратурой прошлых лет и гражданской радиосетью). А Есу и Айкомы это игрушки подешевле - для моряков и радиолюбителей. Но и они через пару лет до такого "додумаются"...

Цитата(shf_05 @ Oct 19 2008, 19:35)

можно ли как-то предисказить речевой сигнал, чтобы что-то полезное из этого получить?

ага....положить в MELP->какой-нибудь сверточный кодер->OFDM

fontp

Oct 21 2008, 14:26

Цитата(DRUID3 @ Oct 20 2008, 23:31)

Мало того, MELP-600 звучит достаточно качественно для служебной телефонной связи (невпремер лучше многих служебных SSBшек) и если его "вложить" в любой код исправляющий ошибки(а лучше одинаково не коррелируемый как с гармоническими сигналами так и широкополосным шумом) то в 3-х kHz отведенных под SSB можно получить намного более качественный канал связи чем этот аналоговый пережиток.

ага....положить в MELP->какой-нибудь сверточный кодер->OFDM

А как Вы сделаете melp600, если Вам не доступен ни текст стандарта, ни референс-код. Я понимаю melp1200/2400 или даже, сделать что-то свое, получше melp600, проприетарное понимаю... Но по статьям в IEEE нельзя восстановить обширнейшие таблицы векторного квантования, разве что свои делать... В статьях только общие принципы.

Я же предлагал послать Вас, как гауляйтера, в НАТО за кодеком. Так Вы не захотели

PS. Кстати я попросил как-то на одном форуме реф-код 600. Так мне пришло письмо от держателя лицензии:

We have noted your interest in downloading MELPe/MELP source code.
Please be advised that the MELPe source code is copyright protected.
Compandent is one of the Intellectual Property owners of MELPe and its
source code, and we take this matter very seriously. Please be advised
that you were not authorized to copy or make a copy of the software
and/or commercialize it!

Should you be interested in MELPe/MELP licensing, please contact us at:
MELPeInfo@compandent.com

Я, очевидно, комерциализировать его не собирался. Так... по приколу ... для учебных или военных целей только...

INT1

Oct 21 2008, 15:42

Цитата(DRUID3 @ Oct 20 2008, 22:31)

... Мало того, MELP-600 звучит достаточно качественно для служебной телефонной связи ..

600bps конечно впечатляют, но насчет качества- такое впечатление, что после преобразования дикторы переболели ДЦП:
http://www.dsp.sut.ru/eng/products/melp600...p600.html#sound

DRUID3

Oct 22 2008, 08:31

Цитата(fontp @ Oct 21 2008, 17:26)

PS. Кстати я попросил как-то на одном форуме реф-код 600. Так мне пришло письмо от держателя лицензии:

Йа хочу в НАТО

и согласен. Парашют, буденовку и орден Ленина выдадут у Вас или уже в самолете!?

Да, с 600 в широком доступе я погорячился. Но 1200 тоже не плохо. Причем не следует забывать, что 3 kHz это далеко не 3 kbitps.

Кстати о самостоятельном написании вокодера(причем лучше со своими оригинальными идеями) я же не против, давно за это выступал. Токо Фсе сразу в кусты

Цитата(INT1 @ Oct 21 2008, 18:42)

Ну переболели, не переболели, но если бы Вы с недельку по вечерам поболтали по той же "ангаре"(SSB) на 4 или 8 MHz с кораблями в Черном море такую речь Вы бы читали без напряжения.

shf_05

Oct 23 2008, 15:40

все это очень интересно, жаль что речь не основная функция моего аппарата (как обьяснить начальнику что на речь надо пол года?))) ), да и проц похоже не потянет... надо сделать чего пороще и побыстрее, пока реализовано ОБП, думаю попробовать компандер еще...

sff

Oct 24 2008, 12:28

Можно ещё speex посмотреть, там есть сжатие вплодь до 2.15 kbit

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.