Есть задача, которую не удается решить полностью. Необходимо распознавать сигнал контроля посылки вызова (КПВ), формируемого станцией абоненту в процессе установления соединения. Стандартов КПВ существует бесчетное множество. Но проблема не в этом. Сейчас ограничимся только одним российским стандартом: КПВ представляет собой тональный сигнал частотой 425±3 Гц, длительность посылки 1 с, длительность паузы 4 с. Посылка КПВ продолжается пока абонент на дальнем конце не поднимет трубку. Так вот, трудность распознавания заключается в том, что одновременно с КПВ в канале связи может одновременно звучать речь и присутствовать различные звуковые шумы, свойственные офисным помещениям. Соотношение амплитуды КПВ и речи/шума в канале может быть различным. Например КПВ может быть в 2 раза громче речи, либо речь в 2 раза громче КПВ, либо одинаковые по громкости. Короче соотношения любые в пределах разумного. В таких пределах, чтобы "на слух" было не трудно распознать, что идет посылка КПВ на фоне речи/музыки. Самые жесткие ситуации возникают, когда идет посылка КПВ и при этом речь произносится расстягивая гласные звуки и одна из формант речевого сигнала оказывается с частотой близкой 425 Гц, а ширина форманты покрывает полностью 425 Гц.
Так вот, задачу не удается решить полностью. В ситуациях когда в канале присутствует только КПВ в условиях умеренных шумов, распознавание выполняется без проблем ( 1-й способ: полосовой фильтр с центр. част. 425 Гц, режекторный фильтр с центр. част. 425 Гц, проверка на превышение порогов уровней на выходах фильтров; 2-й способ: оценка кросскорреляции каждой пары смежных фреймов длительностью 25 мс). Если же в канале одновременное присутствие КПВ и речи/шума, то в эти моменты не удается распознать присутствие КПВ. Если посмотреть спектрограмму, то сигнал КПВ "замазывается" попадающей на КПВ сильной формантой речи.
Сейчас пока стоит задача хоть как угодно решить задачу. Пусть для этого потребуется сколь угодно мощный вычислитель. Вопрос пока стоит принципиально, как можно решить такую задачу, обеспечив максимальную точность распознавания.
Может есть у кого мысли?
P.S. Человек может различить КПВ "на слух" в таких сложных условиях, то есть в мозге есть некоторые процессы, позволяющие человеку это сделать.
Сообщение отредактировал AVL - Jun 14 2007, 14:53
|