|
передача речи |
|
|
|
Oct 17 2008, 10:30
|

山伏
    
Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294

|
Цитата(shf_05 @ Oct 17 2008, 13:05)  требуется передавать различимую речь в диапазоне частот < 2кГц, передача методом ОБП. вопрос 1. какой диапазон из 20-20000Гц лучше передавать Очень бы хотелось знать - а понимает ли сам автор что спрашивает? Если да то, что я думаю то отсылать к журналу "юный техник" уже поздно... наверное WiKi будет в самый раз... Цитата(shf_05 @ Oct 17 2008, 13:05)  2. каким фильтром лучше выделять (КИХ или БИХ)- те важны ли для кач-ва речи фазовые искажения (вроде как нет)? Для качества речи - да, важны любые искажения, но для качества достаточного для телефонной связи - малозначительны. Со спокойным сердцем можно юзать IIR. Цитата(shf_05 @ Oct 17 2008, 13:05)  смоделил бы в матлабе, да звуковухи щас нет под рукой- негде потестить, (сам себе)Все ругают Win а ведь есть пакеты и пострашнее  ... И намного. Цитата(shf_05 @ Oct 17 2008, 13:05)  а писать на ДСП вроде как лучше что-то боле менее осмысленное.  Да уш... Золотые слова.
--------------------
Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...
|
|
|
|
|
Oct 17 2008, 11:59
|

山伏
    
Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294

|
Цитата(shf_05 @ Oct 17 2008, 14:29)  я отлично понимаю, что сказал) ну не занимался я передачей-обработкой речи, не вижу в этом ничего плохого. к юному технику отсылать не надо, лучше скажите в какой области зв. частот сосредоточена речь.  300-3600 Hz. Стандарт. Частоту дискретизации берут 8000 Hz для телефонного канала. Но если это для "сумасшедших экспериментов" то можно попытаться и гораздо уже 500-1500 тоже можно будет что-то разобрать. Еще к размышлению - если взять большую выборку и накапливать, то получим картину распределения мощности по частотному спектру для телефонных разговоров близкую к участку функции (1/F). Но мощность-мощностью, а характеристика слуха ей не соответствует... Цитата(shf_05 @ Oct 17 2008, 14:49)  спасибо, а если применить командирование(!?) по альфа или ню закону С/Ш улучшится? В смысле компрессию? конечно нет! Компрессия уменьшает количество бит при передаче одного звукового отсчета - а за все в жизни нужно платить... Иными словами звук "загрубляется" отсюда и уменьшение С/Ш. Но о каком улучшении вообще речь? Лучше чем в оригинале!?
--------------------
Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...
|
|
|
|
|
Oct 17 2008, 12:40
|

Ambidexter
    
Группа: Свой
Сообщений: 1 589
Регистрация: 22-06-06
Из: Oxford, UK
Пользователь №: 18 282

|
В телефонии принято работать с полосой 300-3400 Гц, общественная практика показывает, что распознаваемость речи в такой полосе практически достаточна. Если сужать полосу, то распознаваемость ухудшится, насколько - трудно сказать, зависит от применения. Ссылка отсюда http://en.wikipedia.org/wiki/Vocal_rangeIn terms of frequency, human voices are roughly in the range of 80 Hz to 1100 Hz (that is, E2 to C6) for normal male and female voices together.
--------------------
Делай сразу хорошо, плохо само получится
|
|
|
|
|
Oct 17 2008, 13:45
|
deleted
   
Группа: Свой
Сообщений: 555
Регистрация: 28-08-05
Пользователь №: 8 024

|
Вобще то в аналоговой радиотелефонии, а особенно в ОБП(SSB) если я правильно расшифровал аббревиатуру, динамический диапазон сжимают, -для улучшения энергетиики(использования мощности) передатчика. Применяются два способа, по отделности, или в комбинации: - сжате динамического диапазона (пик -фактора) по среднему уровню сигнала по типу медленного АРУ; - амплитудное ограничение ("клиппирование"); У каждого из способов свои преимущества и недостатки. Почему то вспомнилась старинная книга  , вот из нее пара страниц (djvu):
|
|
|
|
|
Oct 17 2008, 14:06
|

山伏
    
Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294

|
Цитата(INT1 @ Oct 17 2008, 16:45)  Вобще то в аналоговой радиотелефонии, а особенно в ОБП(SSB) если я правильно расшифровал аббревиатуру, динамический диапазон сжимают, -для улучшения энергетиики(использования мощности) передатчика. Почему то вспомнилась старинная книга  , вот из нее пара страниц (djvu):  ага, т.е. стремятся убрать(уменьшить) амплитудную составляющую и фактически выродить SSB в PhM. Но аналоговое ограничение и цифровое компандирование применяются для абсолютно разных целей хоть и имеют сходную "математическую подоплеку". Уменьшив число бит в цифровом сигнале мы необратимо теряем его часть(вот уже и шум). Компрессия же аналогового голосового SSB канала опиралась на тот факт, что такие предыскажения не делают заметных ухудшений восприятия голоса(это из области психологии и физиологии) что совершенно не так для любого автоматического детектора. Если посидеть и вдуматься то понятно, что в аналоговой линии биты не терялись они "приуменьшались"
--------------------
Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...
|
|
|
|
|
Oct 17 2008, 14:34
|
deleted
   
Группа: Свой
Сообщений: 555
Регистрация: 28-08-05
Пользователь №: 8 024

|
Ну, я исхожу из того, что в радиотелефонной связи основной задачей является донесение смысловой информации сообщеня с минимальными потарями и затратами (частотного ресурса в частноти), а не тембровых окрасок голоса или оттенков настроения оператора(ши).В таком ключе можно двинуться дальше, -Вас МП3 устраивает?, -но это уже отклонение от темы  . ЗЫ, как бы замечание, аналоговый сигнал -это уже SSB, только с "нулевой несущей" . Термин ОБП появляется, когда возникает вопрос его "доставки" адресату, т.е. перенос его спектра в область радиочастот. Отсюда, при использовании радиоканала и реализации его максимальной эффективности стремятся: - максимально возможно сузить спектр и тем самым увеличить с/ш ; - максимально использовать мощность передатчика, т.е. понизить пикфактор речи
|
|
|
|
|
Oct 17 2008, 15:53
|
Профессионал
    
Группа: Свой
Сообщений: 1 143
Регистрация: 22-04-08
Из: г. Екатеринбург
Пользователь №: 36 992

|
моя задача довольно проста- передать различимую речь в пределах полосы передаваемого с-ла 2кГц, целью сужения полосы является не получение СШ, а ограничения в полосе перед. с-ла- эдакий "плохой телефонный канал". про компандирование я понимаю, что инф-я теряется при сжатии, надеялся. что при нелинейном преобразовании улучшится соотношение СШ (при его передаче по зашум. каналу.) для маленьких уровней с-ла- ведь он усиляется больше, чем при линейном или я что-то путаю (помню что-то такое из маг. записи звука)? алгорим сжатия речи, (если будет применен) желательно нетребовательный к ресурсам- проц у меня adsp2191 и то занят др. задачами на 70%. PS: сделал полосу 300-1500 ф-м КИХ 33-го (Fs=8000) порядка, преобр. г-та 30-го пор. на КИХ ф-ре, проверил- впечатление, что собеседник с насморком, но речь понятна). жду дальнейших предложений по улучшению кач-ва, буду благодарен за помощь. Цитата(INT1 @ Oct 17 2008, 19:45)  Почему то вспомнилась старинная книга  , вот из нее пара страниц (djvu): можно ссылку на книгу или ее название, пжста?
|
|
|
|
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|