Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Определение частоты основного тона?
Форум разработчиков электроники ELECTRONIX.ru > Цифровая обработка сигналов - ЦОС (DSP) > Алгоритмы ЦОС (DSP)
Leshii
Существуют ли какие либо разумные, эффективные по вычислениям способы определения частоты основного тона речи кроме как через АКФ фрагмента речи?
WEST128
Можно использовать БПФ или набор фильтров. А потом выделить основную спектральную линию труда не составить.
Grt
Цитата(WEST128 @ Dec 21 2007, 07:21) *
Можно использовать БПФ или набор фильтров. А потом выделить основную спектральную линию труда не составить.


Лучше чем АКФ на текущий момент ничего нет. Только сперва сигнал рекомендуется клиппировать.
Leshii
Ок, спасибо!
Stanislav
Цитата(WEST128 @ Dec 21 2007, 07:21) *
Можно использовать БПФ или набор фильтров. А потом выделить основную спектральную линию труда не составить.
И что Вы далее с БПФ предлагаете делать?
"Основная спектральная линия" практически никогда не совпадает с частотой основного тона. Самыми мощными в речевом сигнале являются форманты.

Цитата(Grt @ Dec 21 2007, 11:02) *
Лучше чем АКФ на текущий момент ничего нет. Только сперва сигнал рекомендуется клиппировать.
Как это нет? И зачем сигнал ещё и клиппировать? wacko.gif При таком подходе вообще ничего не получится.
Автокорреляционный способ может быть приемлем только после основательного "выбеливания" речевого сигнала согласованным фильтром-анализатором (чтобы устранить влияние формант), и ещё дополнительной полосовой ("взвешивающей") фильтрации. Тем не менее, он далеко не свободен от ошибочных решений (как правило, половинного или кратного периода в начале или конце оголосованных - voiced - звуков). Для их коррекции приходится применять эмпирические искусственные процедуры, что очень даже не есть гут.
В то же время, гомоморфный (кепстральный) анализ даёт гораздо более точные результаты, ценой значительно бОльших вычислительных затрат.

В любом случае, стОит разобраться в вокодерных стандартах, и посмотреть, как это реализовано там.
Grt
Цитата(Stanislav @ Jan 8 2008, 04:24) *
И что Вы далее с БПФ предлагаете делать?
"Основная спектральная линия" практически никогда не совпадает с частотой основного тона. Самыми мощными в речевом сигнале являются форманты.

Как это нет? И зачем сигнал ещё и клиппировать? wacko.gif При таком подходе вообще ничего не получится.
Автокорреляционный способ может быть приемлем только после основательного "выбеливания" речевого сигнала согласованным фильтром-анализатором (чтобы устранить влияние формант), и ещё дополнительной полосовой ("взвешивающей") фильтрации. Тем не менее, он далеко не свободен от ошибочных решений (как правило, половинного или кратного периода в начале или конце оголосованных - voiced - звуков). Для их коррекции приходится применять эмпирические искусственные процедуры, что очень даже не есть гут.
В то же время, гомоморфный (кепстральный) анализ даёт гораздо более точные результаты, ценой значительно бОльших вычислительных затрат.

В любом случае, стОит разобраться в вокодерных стандартах, и посмотреть, как это реализовано там.


Рекомендую, как "доктор", AKF c предварительным "центральным" клиппированием. Кроме того при использование AKF можно использовать прореживанием сигнала по частоте, для оптимизации по мипсам.
Stanislav
Цитата(Grt @ Jan 10 2008, 17:19) *
Рекомендую, как "доктор", AKF c предварительным "центральным" клиппированием. Кроме того при использование AKF можно использовать прореживанием сигнала по частоте, для оптимизации по мипсам.
Если не трудно, выложите алгоритм, хотя бы на "пальцах". Что-то мне подсказывает, что при таком подходе получится полный ...гм... швах.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.