реклама на сайте
подробности

 
 
> Help! Алгорит выделения формант, Алгорит (пошагово) выделения формант, на основе кепстрального анализа
Pupupu
сообщение Jan 16 2011, 16:56
Сообщение #1





Группа: Новичок
Сообщений: 4
Регистрация: 16-01-11
Пользователь №: 62 264



Добрый день!

Вопрос к знатокам... так как мне совсем сложно в этой теме.... :'(
Задача : обработка речевого сигнала...для выделения получения формант (чтобы провести анализ полученных данных на основе заданных критериев, например, определение людей с некоторыми заболеваниями)
Сделано:
1. Описано схема устройства - микрофон - полосные фильтры - АЦП - Анализ данных
2.обоснован выбор кепстрального анализа
3. реализация вычисление кепстра ДПФ - Log - обратное ДПФ

В итоге с кепстра нужно выделить форманты с помощью некоторого алгоритма, вот тут у меня полный ступор... :wall:
Никакой инфы найти не могу... кроме книги : Рабинера - Цифровая обработка речевых сигналов (там непонятно описано)

Если, есть возможность скиньте ссылки на рускоязычные источники, с описанием алгоритма (блок-схемы)...


Спасибо заранее огромное. :yes:

Можно писать на enen.o@ya.ru
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Mad_max
сообщение Feb 4 2011, 15:10
Сообщение #2


Местный
***

Группа: Свой
Сообщений: 377
Регистрация: 23-12-06
Из: Зеленоград
Пользователь №: 23 811



Цитата(Pupupu @ Jan 16 2011, 20:56) *
Добрый день!

Вопрос к знатокам... так как мне совсем сложно в этой теме.... :'(
Задача : обработка речевого сигнала...для выделения получения формант (чтобы провести анализ полученных данных на основе заданных критериев, например, определение людей с некоторыми заболеваниями)
Сделано:
1. Описано схема устройства - микрофон - полосные фильтры - АЦП - Анализ данных
2.обоснован выбор кепстрального анализа
3. реализация вычисление кепстра ДПФ - Log - обратное ДПФ

В итоге с кепстра нужно выделить форманты с помощью некоторого алгоритма, вот тут у меня полный ступор... :wall:
Никакой инфы найти не могу... кроме книги : Рабинера - Цифровая обработка речевых сигналов (там непонятно описано)

Если, есть возможность скиньте ссылки на рускоязычные источники, с описанием алгоритма (блок-схемы)...


Спасибо заранее огромное. :yes:

Можно писать на enen.o@ya.ru


Поделитесь ума заключениями насчет обоснования выбора кепстрального анализа,
тогда можно будет подискутировани на предмет выбора алгоритма обнаружения.

А информации на русском по данной тематике просто нет, Рабинер, Шефер еще пару японцев опубликовали
работу по этому поводу в 60-х, но там подход с аппроксимацией речи Гаусовым процессом, мне кажется тупиковым.
Работы все эти разумеется в оригинале.
Go to the top of the page
 
+Quote Post
Pupupu
сообщение Feb 4 2011, 20:30
Сообщение #3





Группа: Новичок
Сообщений: 4
Регистрация: 16-01-11
Пользователь №: 62 264



Цитата(Mad_max @ Feb 4 2011, 18:10) *
Поделитесь ума заключениями насчет обоснования выбора кепстрального анализа,
тогда можно будет подискутировани на предмет выбора алгоритма обнаружения.

А информации на русском по данной тематике просто нет, Рабинер, Шефер еще пару японцев опубликовали
работу по этому поводу в 60-х, но там подход с аппроксимацией речи Гаусовым процессом, мне кажется тупиковым.
Работы все эти разумеется в оригинале.


Вы знаете, кепстральный анализ уже переиграли на обычный спектральный. А алгоритм определения формант применяем описанный ниже...
Но это мне кажется притянутым за уши, т.к. не учитывает допустим вариант с формантами буквы "И", когда вторая форманта в несколько раз больше первой...а не в 2. Сам шаг поиска формант...определяемый как равный первой форманте мне кажется не совсем верным....Непонятно как определить окно поиска формант (пока определяем как полшага назад и полшага вперед для предпологаемой форманнты).

Вообщем, может быть вы подскажите более простой-действенный способ определения формант?
Спектральный анализ не аксиома...



"Известно, что первая форманта (частота основного тона) лежит в промежутке от 50 Гц (у взрослого мужчины) до 300 Гц ( у детей и некоторых женщин). Кроме того известно, что амплитуда каждой последующей форманты ниже, чем предыдущей, а их частоты равны частоте основного тона умноженного на целое число (2 для F1, 3 для F2 и так далее).
Таким образом мы можем найти максимальное значение амплитуды сигнала на отрезке от 50 Гц до 300 Гц, после чего умножить эту частоту на 2, найти максимальное значение амплитуды в некоторой окрестности этой точки, проверить является ли она максимумом амплитуды в некоторой большей окрестности. Если это предположение верно, то мы нашли частоту второй форманты (F1). Если нет – второй форманты у сигнала нет.
Далее умножаем частоту основного тона на три и повторяем все вышеприведенные шаги для третьей форманты. Потом повторяем для всех остальных формант. Как правило, вычисляют от 4 до 6 формант."
Go to the top of the page
 
+Quote Post
Mad_max
сообщение Feb 5 2011, 01:00
Сообщение #4


Местный
***

Группа: Свой
Сообщений: 377
Регистрация: 23-12-06
Из: Зеленоград
Пользователь №: 23 811



Ну я так понимаю, Вы хотите просто установить факт наличия в сигнале некоторых составляющих.

Тогда лучше оптимальной фильтрации еще ничего не придумали, в книгах по аудиологии можно найти
форму формант во временной области и их состав в частотной области.

С точки зрения вычисления все сводится к свертке.
А признаком наличия искомого фрагмента будет пик корреляции.

Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 14th August 2025 - 06:50
Рейтинг@Mail.ru


Страница сгенерированна за 0.0141 секунд с 7
ELECTRONIX ©2004-2016