Цитата(Mad_max @ Feb 4 2011, 18:10)

Поделитесь ума заключениями насчет обоснования выбора кепстрального анализа,
тогда можно будет подискутировани на предмет выбора алгоритма обнаружения.
А информации на русском по данной тематике просто нет, Рабинер, Шефер еще пару японцев опубликовали
работу по этому поводу в 60-х, но там подход с аппроксимацией речи Гаусовым процессом, мне кажется тупиковым.
Работы все эти разумеется в оригинале.
Вы знаете, кепстральный анализ уже переиграли на обычный спектральный. А алгоритм определения формант применяем описанный ниже...
Но это мне кажется притянутым за уши, т.к. не учитывает допустим вариант с формантами буквы "И", когда вторая форманта в несколько раз больше первой...а не в 2. Сам шаг поиска формант...определяемый как равный первой форманте мне кажется не совсем верным....Непонятно как определить окно поиска формант (пока определяем как полшага назад и полшага вперед для предпологаемой форманнты).
Вообщем, может быть вы подскажите более простой-действенный способ определения формант?
Спектральный анализ не аксиома...
"Известно, что первая форманта (частота основного тона) лежит в промежутке от 50 Гц (у взрослого мужчины) до 300 Гц ( у детей и некоторых женщин). Кроме того известно, что амплитуда каждой последующей форманты ниже, чем предыдущей, а их частоты равны частоте основного тона умноженного на целое число (2 для F1, 3 для F2 и так далее).
Таким образом мы можем найти максимальное значение амплитуды сигнала на отрезке от 50 Гц до 300 Гц, после чего умножить эту частоту на 2, найти максимальное значение амплитуды в некоторой окрестности этой точки, проверить является ли она максимумом амплитуды в некоторой большей окрестности. Если это предположение верно, то мы нашли частоту второй форманты (F1). Если нет – второй форманты у сигнала нет.
Далее умножаем частоту основного тона на три и повторяем все вышеприведенные шаги для третьей форманты. Потом повторяем для всех остальных формант. Как правило, вычисляют от 4 до 6 формант."