реклама на сайте
подробности

 
 
> Обнаружение речи
mikalaha
сообщение Jul 9 2007, 05:42
Сообщение #1


Участник
*

Группа: Участник
Сообщений: 42
Регистрация: 16-05-07
Пользователь №: 27 771



Есть задача по обнаружению речи. Точнее по отделению речи от технических сигналов (тонов, полосовых сигналов) в полосе стандартного телефонного канала (0.3 - 3.4 кГц). Пробовал делать через БПФ - неудачно, так как после усреднения спектра на некотором участке голос становился очень похож на ряд технических сигналов - ложное срабатывание.
Потом переместился во временную область - здесь признаком речи выступала производная дисперсии сигнала ( скорость изменения сигнала) на коротких участках (до 0.5 сек). Здесь результаты получились более лучшие, но появилось много пропусков цели - на участках, где человек говорил немного (отдельные фразы). Есть ли у кого-нибудь опыт работы в данной теме?. Буду очень признателен за ссылки, идеи и т.д.
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Mc_off
сообщение Jul 10 2007, 05:12
Сообщение #2


Местный
***

Группа: Свой
Сообщений: 263
Регистрация: 2-01-07
Из: Ростовская область
Пользователь №: 24 044



Может подойти с другого конца?

Определяйте не голос, а "не голос". Т.е. определитесь с тем какие технические сигналы могут прозодить в вашей линии и детектируйте их.

Думаю это будет проще, т.к. "технические сигналы" более детерминированные.

Правда, если будет очень широкополосный сигнал, то его сложно отличить от шума...
Кроме того, помехи - эо тоже сигналы...

А вообще даже немного завидую. Интересная задача.
Go to the top of the page
 
+Quote Post
mikalaha
сообщение Jul 10 2007, 07:03
Сообщение #3


Участник
*

Группа: Участник
Сообщений: 42
Регистрация: 16-05-07
Пользователь №: 27 771



Цитата(Mc_off @ Jul 10 2007, 09:12) *
Может подойти с другого конца?

Определяйте не голос, а "не голос". Т.е. определитесь с тем какие технические сигналы могут прозодить в вашей линии и детектируйте их.

Думаю это будет проще, т.к. "технические сигналы" более детерминированные.

Правда, если будет очень широкополосный сигнал, то его сложно отличить от шума...
Кроме того, помехи - эо тоже сигналы...

А вообще даже немного завидую. Интересная задача.


Определять только технические сигналы - это действительно выход, но ... есть один нюанс:
некоторые сигналы (а именно ряд узких по спектру и коротких по времени ЧМ передач и ФМ-передач) детектируются на голосе ( по спектральным признакам). Кроме того некоторые даже демодулируются и в демодулированных данных иногда СХОДИТСЯ CRC! (пару раз было). Кроме того на речи проскакивают иногда такие чудеса, что вся логика дальнейшей обработки идет коту под хвост. Либо надо усложнять и без того накрученную логику обработки (какие сигналы могут в данный момент появиться , а какие не могут) - что не особенно правильно.
Поэтому был выбран путь обнаружения речи. Результаты такие, что когда кто-то говорит долго - это определяется, а если отдельные фразы - то нет.
Видимо, необходимо делать согласованный спектрально-временной анализ - но пока не знаю как.
Поэтому и затронул эту действительно интересную тему.
Спасибо за поддержку.
Go to the top of the page
 
+Quote Post
Oldring
сообщение Jul 10 2007, 08:43
Сообщение #4


Гуру
******

Группа: Свой
Сообщений: 3 041
Регистрация: 10-01-05
Из: Москва
Пользователь №: 1 874



Цитата(mikalaha @ Jul 10 2007, 11:03) *
Кроме того некоторые даже демодулируются и в демодулированных данных иногда СХОДИТСЯ CRC! (пару раз было).


Значит, слишком котороткий CRC.


--------------------
Пишите в личку.
Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 23rd June 2025 - 07:07
Рейтинг@Mail.ru


Страница сгенерированна за 0.01389 секунд с 7
ELECTRONIX ©2004-2016