Форум разработчиков электроники ELECTRONIX.ru > Help! Алгорит выделения формант

Pupupu

Jan 16 2011, 16:56

Добрый день!

Вопрос к знатокам... так как мне совсем сложно в этой теме.... :'(
Задача : обработка речевого сигнала...для выделения получения формант (чтобы провести анализ полученных данных на основе заданных критериев, например, определение людей с некоторыми заболеваниями)
Сделано:
1. Описано схема устройства - микрофон - полосные фильтры - АЦП - Анализ данных
2.обоснован выбор кепстрального анализа
3. реализация вычисление кепстра ДПФ - Log - обратное ДПФ

В итоге с кепстра нужно выделить форманты с помощью некоторого алгоритма, вот тут у меня полный ступор... :wall:
Никакой инфы найти не могу... кроме книги : Рабинера - Цифровая обработка речевых сигналов (там непонятно описано)

Если, есть возможность скиньте ссылки на рускоязычные источники, с описанием алгоритма (блок-схемы)...

Спасибо заранее огромное. :yes:

Можно писать на enen.o@ya.ru

Mad_max

Feb 4 2011, 15:10

Цитата(Pupupu @ Jan 16 2011, 20:56)

Добрый день!

Вопрос к знатокам... так как мне совсем сложно в этой теме.... :'(
Задача : обработка речевого сигнала...для выделения получения формант (чтобы провести анализ полученных данных на основе заданных критериев, например, определение людей с некоторыми заболеваниями)
Сделано:
1. Описано схема устройства - микрофон - полосные фильтры - АЦП - Анализ данных
2.обоснован выбор кепстрального анализа
3. реализация вычисление кепстра ДПФ - Log - обратное ДПФ

В итоге с кепстра нужно выделить форманты с помощью некоторого алгоритма, вот тут у меня полный ступор... :wall:
Никакой инфы найти не могу... кроме книги : Рабинера - Цифровая обработка речевых сигналов (там непонятно описано)

Если, есть возможность скиньте ссылки на рускоязычные источники, с описанием алгоритма (блок-схемы)...

Спасибо заранее огромное. :yes:

Можно писать на enen.o@ya.ru

Поделитесь ума заключениями насчет обоснования выбора кепстрального анализа,
тогда можно будет подискутировани на предмет выбора алгоритма обнаружения.

А информации на русском по данной тематике просто нет, Рабинер, Шефер еще пару японцев опубликовали
работу по этому поводу в 60-х, но там подход с аппроксимацией речи Гаусовым процессом, мне кажется тупиковым.
Работы все эти разумеется в оригинале.

Pupupu

Feb 4 2011, 20:30

Цитата(Mad_max @ Feb 4 2011, 18:10)

Поделитесь ума заключениями насчет обоснования выбора кепстрального анализа,
тогда можно будет подискутировани на предмет выбора алгоритма обнаружения.

А информации на русском по данной тематике просто нет, Рабинер, Шефер еще пару японцев опубликовали
работу по этому поводу в 60-х, но там подход с аппроксимацией речи Гаусовым процессом, мне кажется тупиковым.
Работы все эти разумеется в оригинале.

Вы знаете, кепстральный анализ уже переиграли на обычный спектральный. А алгоритм определения формант применяем описанный ниже...
Но это мне кажется притянутым за уши, т.к. не учитывает допустим вариант с формантами буквы "И", когда вторая форманта в несколько раз больше первой...а не в 2. Сам шаг поиска формант...определяемый как равный первой форманте мне кажется не совсем верным....Непонятно как определить окно поиска формант (пока определяем как полшага назад и полшага вперед для предпологаемой форманнты).

Вообщем, может быть вы подскажите более простой-действенный способ определения формант?
Спектральный анализ не аксиома...

"Известно, что первая форманта (частота основного тона) лежит в промежутке от 50 Гц (у взрослого мужчины) до 300 Гц ( у детей и некоторых женщин). Кроме того известно, что амплитуда каждой последующей форманты ниже, чем предыдущей, а их частоты равны частоте основного тона умноженного на целое число (2 для F1, 3 для F2 и так далее).
Таким образом мы можем найти максимальное значение амплитуды сигнала на отрезке от 50 Гц до 300 Гц, после чего умножить эту частоту на 2, найти максимальное значение амплитуды в некоторой окрестности этой точки, проверить является ли она максимумом амплитуды в некоторой большей окрестности. Если это предположение верно, то мы нашли частоту второй форманты (F1). Если нет – второй форманты у сигнала нет.
Далее умножаем частоту основного тона на три и повторяем все вышеприведенные шаги для третьей форманты. Потом повторяем для всех остальных формант. Как правило, вычисляют от 4 до 6 формант."

Mad_max

Feb 5 2011, 01:00

Ну я так понимаю, Вы хотите просто установить факт наличия в сигнале некоторых составляющих.

Тогда лучше оптимальной фильтрации еще ничего не придумали, в книгах по аудиологии можно найти
форму формант во временной области и их состав в частотной области.

С точки зрения вычисления все сводится к свертке.
А признаком наличия искомого фрагмента будет пик корреляции.

Alexey Lukin

Feb 6 2011, 03:39

Цитата(Pupupu @ Feb 5 2011, 00:30)

"Известно, что первая форманта (частота основного тона)

Уже это неверно. Форманты и частота основного тона совершенно не связаны между собой по частоте.

Цитата(Pupupu @ Feb 5 2011, 00:30)

Таким образом мы можем найти максимальное значение амплитуды сигнала на отрезке от 50 Гц до 300 Гц, после чего умножить эту частоту на 2, найти максимальное значение амплитуды в некоторой окрестности этой точки, проверить является ли она максимумом амплитуды в некоторой большей окрестности. Если это предположение верно, то мы нашли частоту второй форманты (F1). Если нет – второй форманты у сигнала нет. Далее умножаем частоту основного тона на три и повторяем все вышеприведенные шаги для третьей форманты. Потом повторяем для всех остальных формант. Как правило, вычисляют от 4 до 6 формант."

Таким образом вы найдёте не форманты, а гармоники сигнала.

Kluwert

Feb 7 2011, 10:30

Задача определения гармоник в спектре очень - очень популярна в среде людей, занимающихся сверхразрешением. Для подсчета числа гармоник наиболее часто используют критерий Акаике или MDL. По этому поводу смотрите книжку Марпла, глава, если не изменяет память, посвященная MUSIC'у. Ну а посчитав число гармоник, можно теми же MUSIC'ами, методами Прони, Монакова, Писаренко и т.д. (их там до *опы напридумано) вычислить точное положение этих гармоник.

Ну вот как-то так.