Форум разработчиков электроники ELECTRONIX.ru > Определение частоты основного тона?

Leshii

Dec 19 2007, 09:32

Существуют ли какие либо разумные, эффективные по вычислениям способы определения частоты основного тона речи кроме как через АКФ фрагмента речи?

WEST128

Dec 21 2007, 04:21

Можно использовать БПФ или набор фильтров. А потом выделить основную спектральную линию труда не составить.

Grt

Dec 21 2007, 08:02

Цитата(WEST128 @ Dec 21 2007, 07:21)

Можно использовать БПФ или набор фильтров. А потом выделить основную спектральную линию труда не составить.

Лучше чем АКФ на текущий момент ничего нет. Только сперва сигнал рекомендуется клиппировать.

Leshii

Dec 21 2007, 08:36

Ок, спасибо!

Stanislav

Jan 8 2008, 01:24

Цитата(WEST128 @ Dec 21 2007, 07:21)

Можно использовать БПФ или набор фильтров. А потом выделить основную спектральную линию труда не составить.

И что Вы далее с БПФ предлагаете делать?
"Основная спектральная линия" практически никогда не совпадает с частотой основного тона. Самыми мощными в речевом сигнале являются форманты.

Цитата(Grt @ Dec 21 2007, 11:02)

Лучше чем АКФ на текущий момент ничего нет. Только сперва сигнал рекомендуется клиппировать.

Как это нет? И зачем сигнал ещё и клиппировать?

При таком подходе вообще ничего не получится.
Автокорреляционный способ может быть приемлем только после основательного "выбеливания" речевого сигнала согласованным фильтром-анализатором (чтобы устранить влияние формант), и ещё дополнительной полосовой ("взвешивающей") фильтрации. Тем не менее, он далеко не свободен от ошибочных решений (как правило, половинного или кратного периода в начале или конце оголосованных - voiced - звуков). Для их коррекции приходится применять эмпирические искусственные процедуры, что очень даже не есть гут.
В то же время, гомоморфный (кепстральный) анализ даёт гораздо более точные результаты, ценой значительно бОльших вычислительных затрат.

В любом случае, стОит разобраться в вокодерных стандартах, и посмотреть, как это реализовано там.

Grt

Jan 10 2008, 14:19

Цитата(Stanislav @ Jan 8 2008, 04:24)

И что Вы далее с БПФ предлагаете делать?
"Основная спектральная линия" практически никогда не совпадает с частотой основного тона. Самыми мощными в речевом сигнале являются форманты.

Как это нет? И зачем сигнал ещё и клиппировать?

При таком подходе вообще ничего не получится.
Автокорреляционный способ может быть приемлем только после основательного "выбеливания" речевого сигнала согласованным фильтром-анализатором (чтобы устранить влияние формант), и ещё дополнительной полосовой ("взвешивающей") фильтрации. Тем не менее, он далеко не свободен от ошибочных решений (как правило, половинного или кратного периода в начале или конце оголосованных - voiced - звуков). Для их коррекции приходится применять эмпирические искусственные процедуры, что очень даже не есть гут.
В то же время, гомоморфный (кепстральный) анализ даёт гораздо более точные результаты, ценой значительно бОльших вычислительных затрат.

В любом случае, стОит разобраться в вокодерных стандартах, и посмотреть, как это реализовано там.

Рекомендую, как "доктор", AKF c предварительным "центральным" клиппированием. Кроме того при использование AKF можно использовать прореживанием сигнала по частоте, для оптимизации по мипсам.

Stanislav

Jan 10 2008, 14:41

Цитата(Grt @ Jan 10 2008, 17:19)

Рекомендую, как "доктор", AKF c предварительным "центральным" клиппированием. Кроме того при использование AKF можно использовать прореживанием сигнала по частоте, для оптимизации по мипсам.

Если не трудно, выложите алгоритм, хотя бы на "пальцах". Что-то мне подсказывает, что при таком подходе получится полный ...гм... швах.