передача речи - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Wiki

Photo

Forum

Forum

Reviews

Reviews

Help (!)

Help (!)

Правила Форума

Пользователи

Календарь

Личная почта

Панель управления

Форум разработчиков электроники ELECTRONIX.ru > Цифровая обработка сигналов - ЦОС (DSP) > Алгоритмы ЦОС (DSP)

2 страниц

1 2 >

Reply to this topic

Start new topic

передача речи

shf_05 Просмотр профиля	Oct 17 2008, 10:05 Сообщение #1
Профессионал Группа: Свой Сообщений: 1 143 Регистрация: 22-04-08 Из: г. Екатеринбург Пользователь №: 36 992	требуется передавать различимую речь в диапазоне частот < 2кГц, передача методом ОБП. вопрос 1. какой диапазон из 20-20000Гц лучше передавать, 2. каким фильтром лучше выделять (КИХ или БИХ)- те важны ли для кач-ва речи фазовые искажения (вроде как нет)? смоделил бы в матлабе, да звуковухи щас нет под рукой- негде потестить, а писать на ДСП вроде как лучше что-то боле менее осмысленное.- подскажите нужное направление.

DRUID3 Просмотр профиля	Oct 17 2008, 10:30 Сообщение #2
山伏 Группа: Свой Сообщений: 1 827 Регистрация: 3-08-06 Из: Kyyiv Пользователь №: 19 294	Цитата(shf_05 @ Oct 17 2008, 13:05) требуется передавать различимую речь в диапазоне частот < 2кГц, передача методом ОБП. вопрос 1. какой диапазон из 20-20000Гц лучше передавать Очень бы хотелось знать - а понимает ли сам автор что спрашивает? Если да то, что я думаю то отсылать к журналу "юный техник" уже поздно... наверное WiKi будет в самый раз... Цитата(shf_05 @ Oct 17 2008, 13:05) 2. каким фильтром лучше выделять (КИХ или БИХ)- те важны ли для кач-ва речи фазовые искажения (вроде как нет)? Для качества речи - да, важны любые искажения, но для качества достаточного для телефонной связи - малозначительны. Со спокойным сердцем можно юзать IIR. Цитата(shf_05 @ Oct 17 2008, 13:05) смоделил бы в матлабе, да звуковухи щас нет под рукой- негде потестить, (сам себе)Все ругают Win а ведь есть пакеты и пострашнее ... И намного. Цитата(shf_05 @ Oct 17 2008, 13:05) а писать на ДСП вроде как лучше что-то боле менее осмысленное. Да уш... Золотые слова. -------------------- Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...

shf_05 Просмотр профиля	Oct 17 2008, 11:29 Сообщение #3
Профессионал Группа: Свой Сообщений: 1 143 Регистрация: 22-04-08 Из: г. Екатеринбург Пользователь №: 36 992	я отлично понимаю, что сказал) ну не занимался я передачей-обработкой речи, не вижу в этом ничего плохого. к юному технику отсылать не надо, лучше скажите в какой области зв. частот сосредоточена речь.

HardJoker Просмотр профиля	Oct 17 2008, 11:46 Сообщение #4
Знающий Группа: Свой Сообщений: 995 Регистрация: 3-06-05 Пользователь №: 5 713	Цитата(shf_05 @ Oct 17 2008, 15:29) я отлично понимаю, что сказал) ну не занимался я передачей-обработкой речи, не вижу в этом ничего плохого. к юному технику отсылать не надо, лучше скажите в какой области зв. частот сосредоточена речь. Если помоможет, для каналов ТфОП (они же абонентские окончания) диапазон 300Hz...3400Hz, приказ N43 от 15.04.96 "Об утверждении Норм на электрические параметры каналов тональной частоты магистральной и внутризоновых первичных сетей", МИНИСТЕРСТВО СВЯЗИ РОССИЙСКОЙ ФЕДЕРАЦИИ

shf_05 Просмотр профиля	Oct 17 2008, 11:49 Сообщение #5
Профессионал Группа: Свой Сообщений: 1 143 Регистрация: 22-04-08 Из: г. Екатеринбург Пользователь №: 36 992	спасибо, а если применить командирование по альфа или ню закону С/Ш улучшится?

DRUID3 Просмотр профиля	Oct 17 2008, 11:59 Сообщение #6
山伏 Группа: Свой Сообщений: 1 827 Регистрация: 3-08-06 Из: Kyyiv Пользователь №: 19 294	Цитата(shf_05 @ Oct 17 2008, 14:29) я отлично понимаю, что сказал) ну не занимался я передачей-обработкой речи, не вижу в этом ничего плохого. к юному технику отсылать не надо, лучше скажите в какой области зв. частот сосредоточена речь. 300-3600 Hz. Стандарт. Частоту дискретизации берут 8000 Hz для телефонного канала. Но если это для "сумасшедших экспериментов" то можно попытаться и гораздо уже 500-1500 тоже можно будет что-то разобрать. Еще к размышлению - если взять большую выборку и накапливать, то получим картину распределения мощности по частотному спектру для телефонных разговоров близкую к участку функции (1/F). Но мощность-мощностью, а характеристика слуха ей не соответствует... Цитата(shf_05 @ Oct 17 2008, 14:49) спасибо, а если применить командирование(!?) по альфа или ню закону С/Ш улучшится? В смысле компрессию? конечно нет! Компрессия уменьшает количество бит при передаче одного звукового отсчета - а за все в жизни нужно платить... Иными словами звук "загрубляется" отсюда и уменьшение С/Ш. Но о каком улучшении вообще речь? Лучше чем в оригинале!? -------------------- Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...

=GM= Просмотр профиля	Oct 17 2008, 12:40 Сообщение #7
Ambidexter Группа: Свой Сообщений: 1 589 Регистрация: 22-06-06 Из: Oxford, UK Пользователь №: 18 282	В телефонии принято работать с полосой 300-3400 Гц, общественная практика показывает, что распознаваемость речи в такой полосе практически достаточна. Если сужать полосу, то распознаваемость ухудшится, насколько - трудно сказать, зависит от применения. Ссылка отсюда http://en.wikipedia.org/wiki/Vocal_range In terms of frequency, human voices are roughly in the range of 80 Hz to 1100 Hz (that is, E2 to C6) for normal male and female voices together. -------------------- Делай сразу хорошо, плохо само получится

Maverick Просмотр профиля	Oct 17 2008, 12:53 Сообщение #8
я только учусь... Группа: Модераторы Сообщений: 3 447 Регистрация: 29-01-07 Из: Украина Пользователь №: 24 839	Посмотрите это может поможет -------------------- If it doesn't work in simulation, it won't work on the board. "Ты живешь в своих поступках, а не в теле. Ты — это твои действия, и нет другого тебя" Антуан де Сент-Экзюпери повесть "Маленький принц"

INT1 Просмотр профиля	Oct 17 2008, 13:45 Сообщение #9
deleted Группа: Свой Сообщений: 555 Регистрация: 28-08-05 Пользователь №: 8 024	Вобще то в аналоговой радиотелефонии, а особенно в ОБП(SSB) если я правильно расшифровал аббревиатуру, динамический диапазон сжимают, -для улучшения энергетиики(использования мощности) передатчика. Применяются два способа, по отделности, или в комбинации: - сжате динамического диапазона (пик -фактора) по среднему уровню сигнала по типу медленного АРУ; - амплитудное ограничение ("клиппирование"); У каждого из способов свои преимущества и недостатки. Почему то вспомнилась старинная книга , вот из нее пара страниц (djvu): Прикрепленные файлы compress_voice.rar ( 66.43 килобайт ) Кол-во скачиваний: 55

DRUID3 Просмотр профиля	Oct 17 2008, 14:06 Сообщение #10
山伏 Группа: Свой Сообщений: 1 827 Регистрация: 3-08-06 Из: Kyyiv Пользователь №: 19 294	Цитата(INT1 @ Oct 17 2008, 16:45) Вобще то в аналоговой радиотелефонии, а особенно в ОБП(SSB) если я правильно расшифровал аббревиатуру, динамический диапазон сжимают, -для улучшения энергетиики(использования мощности) передатчика. Почему то вспомнилась старинная книга , вот из нее пара страниц (djvu): ага, т.е. стремятся убрать(уменьшить) амплитудную составляющую и фактически выродить SSB в PhM. Но аналоговое ограничение и цифровое компандирование применяются для абсолютно разных целей хоть и имеют сходную "математическую подоплеку". Уменьшив число бит в цифровом сигнале мы необратимо теряем его часть(вот уже и шум). Компрессия же аналогового голосового SSB канала опиралась на тот факт, что такие предыскажения не делают заметных ухудшений восприятия голоса(это из области психологии и физиологии) что совершенно не так для любого автоматического детектора. Если посидеть и вдуматься то понятно, что в аналоговой линии биты не терялись они "приуменьшались" -------------------- Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...

INT1 Просмотр профиля	Oct 17 2008, 14:34 Сообщение #11
deleted Группа: Свой Сообщений: 555 Регистрация: 28-08-05 Пользователь №: 8 024	Ну, я исхожу из того, что в радиотелефонной связи основной задачей является донесение смысловой информации сообщеня с минимальными потарями и затратами (частотного ресурса в частноти), а не тембровых окрасок голоса или оттенков настроения оператора(ши).В таком ключе можно двинуться дальше, -Вас МП3 устраивает?, -но это уже отклонение от темы . ЗЫ, как бы замечание, аналоговый сигнал -это уже SSB, только с "нулевой несущей" . Термин ОБП появляется, когда возникает вопрос его "доставки" адресату, т.е. перенос его спектра в область радиочастот. Отсюда, при использовании радиоканала и реализации его максимальной эффективности стремятся: - максимально возможно сузить спектр и тем самым увеличить с/ш ; - максимально использовать мощность передатчика, т.е. понизить пикфактор речи

shf_05 Просмотр профиля	Oct 17 2008, 15:53 Сообщение #12
Профессионал Группа: Свой Сообщений: 1 143 Регистрация: 22-04-08 Из: г. Екатеринбург Пользователь №: 36 992	моя задача довольно проста- передать различимую речь в пределах полосы передаваемого с-ла 2кГц, целью сужения полосы является не получение СШ, а ограничения в полосе перед. с-ла- эдакий "плохой телефонный канал". про компандирование я понимаю, что инф-я теряется при сжатии, надеялся. что при нелинейном преобразовании улучшится соотношение СШ (при его передаче по зашум. каналу.) для маленьких уровней с-ла- ведь он усиляется больше, чем при линейном или я что-то путаю (помню что-то такое из маг. записи звука)? алгорим сжатия речи, (если будет применен) желательно нетребовательный к ресурсам- проц у меня adsp2191 и то занят др. задачами на 70%. PS: сделал полосу 300-1500 ф-м КИХ 33-го (Fs=8000) порядка, преобр. г-та 30-го пор. на КИХ ф-ре, проверил- впечатление, что собеседник с насморком, но речь понятна). жду дальнейших предложений по улучшению кач-ва, буду благодарен за помощь. Цитата(INT1 @ Oct 17 2008, 19:45) Почему то вспомнилась старинная книга , вот из нее пара страниц (djvu): можно ссылку на книгу или ее название, пжста?

INT1 Просмотр профиля	Oct 17 2008, 16:58 Сообщение #13
deleted Группа: Свой Сообщений: 555 Регистрация: 28-08-05 Пользователь №: 8 024	В сети книги нет. Вот залил, и приатачил аннотацию. Конечно, она больше интересна в историческом плане, но написана корифеями от радиоэлектроники. Хотя, как знать, все новое- это давно забытое старое, да и уравнения Максвелла и правило буравчика с тех пор- не изменились http://narod.ru/disk/3248780000/Dict.rar.html Прикрепленные файлы dict_cover.rar ( 62.52 килобайт ) Кол-во скачиваний: 49

Огурцов Просмотр профиля	Oct 17 2008, 17:25 Сообщение #14
Гуру Группа: Участник Сообщений: 3 928 Регистрация: 28-03-07 Из: РФ Пользователь №: 26 588	Поскольку все равно предполагается цифра, я бы попробовал использовать кодек типа MC145481 (мне понравились). Это ацп+фильтр+компрессор(по сути). А при передаче полученный код выводить на 8ми битный цап, как будто он линейный. Смоделировать и послушать что получится можно обработав любой подходящий wav-файл.

INT1 Просмотр профиля	Oct 19 2008, 04:42 Сообщение #15
deleted Группа: Свой Сообщений: 555 Регистрация: 28-08-05 Пользователь №: 8 024	Если предполагается цифра в канале связи, то даже используя готовые аппаратные кодеки в 2кГц никак не влезть. Если цифра в канале обработки аналогового сигнала, то фильтрация и вырезание формант ( как например предлагается в тех древних страничках), в 2кГц возможно и позволит упаковать. Ну а дальше ОБП. Так шта как говорится, тут- ДСП Вам в руки .

« Предыдущая тема · Алгоритмы ЦОС (DSP) · Следующая тема »

2 страниц

1 2 >

Reply to this topic

Start new topic

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 11th August 2025 - 13:53

Страница сгенерированна за 0.01578 секунд с 7
ELECTRONIX ©2004-2016