Помогите понять по алгоритмам VAD - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Photo

Forum

Reviews

Help (!)

Форум разработчиков электроники ELECTRONIX.ru > Цифровая обработка сигналов - ЦОС (DSP) > Алгоритмы ЦОС (DSP)

Помогите понять по алгоритмам VAD, траблы с реализацией

Опции

ksv198 Просмотр профиля	Sep 8 2015, 11:23 Сообщение #1
Частый гость Группа: Участник Сообщений: 177 Регистрация: 25-08-05 Из: Ставрополь Пользователь №: 7 964	Добрый день! Есть проблема с реализацией VAD (Voice Activity Detection). Пытаюсь реализовать на stm32f4xx; входной поток имеет умеренные параметры: 8000 Гц частота дискретизации/ 16 бит /моно (обычный не сжатый PCM). Сам сигнал имеет ограничение по полосе 0 - 4000 Гц (речь), спектр реального сигнала смотрел в Audacity. При применении наиболее распространённых критериев ZCD (zero crossing detector) и STE (short time energy) получается много (недопустимо) ложных срабатываний. Сработку вызывает, например, дыхание в микрофон, шум ветра. Кроме того, критерий ZCD довольно слабо отражает наличие/отсутствие речи. Как обрабатываю: поток принимается в буфер на 512 сэмплов (буферов несколько), режется на фреймы по 8 мс (64 сэмпла, впрочем пробовал и по 16 мс -128 сэмплов, результаты очень мало отличаются), затем считаю количество пересечений нуля и энергию. Пробовал с прямоугольным окном и окном Хэммминга, разница не очень ощутима. Вопрос собственно в чём - какой ещё способ (критерий) применить для VAD, для улучшения распознаваемости речи/паузы? Сигнал сам по себе не зашумлён, SNR больше 20 дБ. Начитался по этой теме уже довольно много, смущает несходимость теории в статьях с получаемым результатом. Кроме того есть непонятка с выбором фреймов - неперекрывающиеся или перекрывающиеся на полфрейма, что лучше? Вычислительных ресурсов вроде бы хватает, могу безболезненно выделить до 15% процессорного времени контроллера (168 МГц).

Ответов

Fat Robot Просмотр профиля	Sep 8 2015, 12:05 Сообщение #2
ʕʘ̅͜ʘ̅ʔ Группа: Свой Сообщений: 1 008 Регистрация: 3-05-05 Пользователь №: 4 691	Может взять готовый? Например из G.729 annex B. Там, я помню, был какой-то навороченный перечень условий для срабатывания. Слабо себе представляю, как его построить самостоятельно.

Сообщений в этой теме

ksv198 Помогите понять по алгоритмам VAD Sep 8 2015, 11:23

Fat Robot Может взять готовый? Например из G.729 annex B. Та... Sep 8 2015, 12:05

ksv198 Цитата(Fat Robot @ Sep 8 2015, 15:05) Мож... Sep 8 2015, 12:13

Fat Robot Стандарту 20 лет как-никак. Так что особой прожорл... Sep 8 2015, 13:15

ksv198 Цитата(Fat Robot @ Sep 8 2015, 16:15) Ста... Sep 8 2015, 13:28

Fat Robot Тогда уж посмотрите еще VAD из кодека gsm amr-2: ... Sep 8 2015, 13:36

« Предыдущая тема · Алгоритмы ЦОС (DSP) · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 21st July 2025 - 07:19