|
Алгоритм поиска основной частоты, Метод максимального правдоподобия |
|
|
|
Jul 1 2011, 06:56
|
Участник

Группа: Участник
Сообщений: 22
Регистрация: 1-07-11
Пользователь №: 66 006

|
Здравствуйте, товарищи.
Мне нужно улучшить алгоритм поиска основной частоты по методу максимального правдоподобия. Был пример у меня, как делать, я его модифицировал в нескольких местах (добавил настраиваемость оконной функции и фильтра). Возможно, некоторые места вам покажутся совершенно абсурдными - но я пока новичок в DSP, некоторые места в старом алгоритме вызывают у меня сильное удивление, но пока не хватает опыта для однозначного решения: или я не понимаю момент, или предыдущий программист допустил косяк.
- Вход: массив байтов byteData длиной sampleLength, количество разбиений sampleRate. - Выход: фундаментальная частота fundamentalFrequency и громкость fundamentalVolume.
Алгоритм: 1. Массив байтов преобразуется в вешественный массив амплитуд. 2. Проверяется максимальная амплитуда - если она ниже определённого значения, то это квалифицируется как почти полная тишина (выход из алгоритма) 3. Получение спектра из массива амплитуд: 3.1. Умножение массива амплитуд на оконную функцию; 3.2. Преобразование Фурье. 4. Фильтрация массива спектральных значений. 5. Расчёт массива громкости (модуль от спектральных значений). 6. Нормализация громкости: 6.1. Поиск максимальной громкости (maxVolume). 6.2. Нормализация (volume[i] = volume[i]/maxVolume); 7. Квалификация спектра как информативного или зашумлённого. 8. Инициализация 3 пиков громкости и соответствующих им частот. 9. Поиск фундаментальной частоты. 9.1. Если один из 2 главных пиков громкости ниже некоторого порога громкости, то выбрать частоту другого главного пика, выход из алгоритма. 9.2. Поиск фундаментальной частоты по 2 главным пикам согласно известным пропорциям 1/2, 1/3, 2/3, 2/5, 3/4, 3/5. 9.3. Коррекция фундаментальной частоты по 3-му пику.
Мне нужно пробежаться по некоторым пунктам, чтобы удостовериться в валидности алгоритма. Пункты 1, 2, 6, 8 и 9 вопросов не вызывают.
Самые горячие вопросы сейчас такие: 1. Правильно ли считается громкость? Массив спектральных значений имеет следующую структуру: в ячейках spectre[2*i] лежат коэффициэнты при косинусах, в spectre[2*i+1] лежат коэффициэнты при синусах. Соответственно, громкость считаю так: volume[i] = sqrt(sqr(spectre[2*i])+sqr(spectre[2*i+1])); Может, таким методом не громкость считается, а что-то другое? 2. Как рассчитать шум? И как рассчитать порог шума (если его превысить, то выход из алгоритма)? Сейчас шум рассчитывается как среднее арифметическое по массиву громкости.
Сообщение отредактировал QuickNick - Jul 1 2011, 07:00
|
|
|
|
|
 |
Ответов
|
Jul 1 2011, 13:58
|
Частый гость
 
Группа: Участник
Сообщений: 161
Регистрация: 22-06-09
Из: Москва
Пользователь №: 50 531

|
Цитата(QuickNick @ Jul 1 2011, 10:56)  Мне нужно улучшить алгоритм поиска основной частоты 1.Во первыых терминология. До БПФ массив называется сигнал или выборка и алгоритм получения выборки не имеет отношения к заданным вопросам. После БПФ массив называется спектр, он комплексный Re и Im. После взятия корня из суммы квадратов получается массив амплитуд гармоник Фурье. 2.Термин "громкость" уже обсуждался и оказалось громкость = максимальная амплитуда. 3.На тему "поиск основной частоты" опубликовано множество работ и продолжает публиковаться. Это означает, что удовлетворяющий всех алгоритм не найден. Но существует множество приближений от самых простых приведенных в работах Куцукоса(Peter Kootsookos) до весьма сложных (Quinn, M. Macleod). Так что вполне можете придумать свой. Можете поискать по словам "estimation" "estimation frequency" "funamental frequency" там много. 4.Рекомендую попробовать такой метод: Окно Гаусса->БПФ->Определить основные вершины->Уточнить вершины по трем точкам. 5.В измерении шума всегда используют критерий мощности. Возвести каждое значение сигнала в квадрат просуммировать разделить на количество и извлечь корень. Или возвести каждое значение амплитуды спектра в квадрат просуммировать и извлечь корень. (Делить не надо). Эти значения должны быть равны.
--------------------
Ты можешь знать все что угодно, но пока ты не доказал это на практике, ты не знаешь ничего!© Ричард Бах
|
|
|
|
|
Jul 1 2011, 14:56
|
Участник

Группа: Участник
Сообщений: 22
Регистрация: 1-07-11
Пользователь №: 66 006

|
Цитата(SPACUM @ Jul 1 2011, 16:58)  1.Во первыых терминология. До БПФ массив называется сигнал или выборка и алгоритм получения выборки не имеет отношения к заданным вопросам. После БПФ массив называется спектр, он комплексный Re и Im. После взятия корня из суммы квадратов получается массив амплитуд гармоник Фурье. 2.Термин "громкость" уже обсуждался и оказалось громкость = максимальная амплитуда. Ага, спасибо, пока ещё "плаваю" в терминологии. Цитата(SPACUM @ Jul 1 2011, 16:58)  5.В измерении шума всегда используют критерий мощности. Возвести каждое значение сигнала в квадрат просуммировать разделить на количество и извлечь корень. Или возвести каждое значение амплитуды спектра в квадрат просуммировать и извлечь корень. (Делить не надо). Эти значения должны быть равны. То есть, "должны"? Они обязательно будут равны или же "если равны, то ..."? Допустим, я получил величину "корень из суммы квадратов амплитуд спектра". У неё какая размерность? Если её поделить на максимальную амплитуду, то это можно будет использовать как некоторый порог шума? Цитата(DRUID3 @ Jul 1 2011, 17:33)  ...бред какой-то )))... Вам нужно удостовериться, что главный пик это голос а потому имеет "ощутимую" 2-ую и третью гармоники... В комментах предыдущих программист так написал: Код // If the volume is one of the 2-harmonics with maximum volume less than the threshold SIGNAL_LEVEL, it makes no sense to use to search for // other harmonics of the fundamental frequency, because they are very weak, and perhaps are simply noise. Return as the fundamental frequency // frequency with the maximum volume
|
|
|
|
|
Jul 1 2011, 15:19
|

山伏
    
Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294

|
Цитата(QuickNick @ Jul 1 2011, 17:56)  В комментах предыдущих программист так написал: Код // If the volume is one of the 2-harmonics with maximum volume less than the threshold SIGNAL_LEVEL, it makes no sense to use to search for // other harmonics of the fundamental frequency, because they are very weak, and perhaps are simply noise. Return as the fundamental frequency // frequency with the maximum volume ...что переводится так - " если высшие гармоники ниже шумового порога нет смысла их искать, они "потоплены" в шуме"... Вы же сделали совсем странные выводы... Кстати, SPACUM, дает Вам не очень грамотные советы(относительно шума) - он, видимо, программист от матлаба. Хотя может Вам тоже прога для матлаба нужна?
--------------------
Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...
|
|
|
|
|
Jul 2 2011, 09:10
|
Участник

Группа: Участник
Сообщений: 22
Регистрация: 1-07-11
Пользователь №: 66 006

|
Цитата(DRUID3 @ Jul 1 2011, 18:19)  ...что переводится так - "если высшие гармоники ниже шумового порога нет смысла их искать, они "потоплены" в шуме"... Вы же сделали совсем странные выводы. Таков алгоритм предыдущего программиста. Повторюсь, всё, что я изменил в нём - это сделал настраиваемость оконных функций и фильтров (в предыдущей версии они были "железно" прописаны). Цитата(DRUID3 @ Jul 1 2011, 18:19)  Кстати, SPACUM, дает Вам не очень грамотные советы(относительно шума) - он, видимо, программист от матлаба. Хотя может Вам тоже прога для матлаба нужна? На Яве пишу.
|
|
|
|
|
Jul 3 2011, 00:09
|

山伏
    
Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294

|
Цитата(QuickNick @ Jul 2 2011, 12:10)  Таков алгоритм предыдущего программиста. Педыдущего если иди сверху? А если серьезнее - не знаю какой там алгоритм, но ваши пункты мало соответствуют тем строчкам на английском языке. что Вы привели. Потому - не знаю что и думать. Цитата(QuickNick @ Jul 2 2011, 12:10)  Повторюсь, всё, что я изменил в нём - это сделал настраиваемость оконных функций и фильтров (в предыдущей версии они были "железно" прописаны). ...а я бы оконные функции выбросил. Размен улучшения разрешения по частоте на уменьшение разрешения по времени(по- сути потерю "энергетики") не оправдывает себя для поиска основного тона. И метрология здесь ни к чему, мало того с окнами она ложная. Цитата(QuickNick @ Jul 2 2011, 12:10)  На Яве пишу. Гы... Прикол. Не забудьте еще частоту дискретизации 8000 выставить, а то наваяете... А какая "ява"? "Наша" или "андроидная"? Я бы делал так: 1) скользящее среднее проверяет наличие звуковой активности(т.к. блок>>фонемы). 2) автокоррелятор проверяет шумовой ли сигнал (единственный пик на 0-е) или колебательный(периодическая автокорреляционная функция). Ну и находим основную частоту - 1/период_автокорреляционной_функции . ))))))) . Но этот путь жрет много ресурсов. Можно автокорреляцию аппроксимировать конечно. Шагать непосэмплово. Но это трудный путь )))... ...тогда так: 1) скользящее среднее проверяет наличие звуковой активности(т.к. блок>>фонемы). 2) если есть активность, то RealFFT начиная с момента активности. 3) Получение быстрой оценки физического спектра - Р.Лайонс ст.475 4) Получить массив указателей на массив значений физического спектра. Ну не знаю как там в Java придумаете. Нужно чтобы и номера отсчетов первоначального спектра остались и отсортированный их массив был. Ну а далее техническое творчество. Если наибольший спектральный компонент не на нулевой частоте и содержит ощутимую часть(вот этот бы порог сделать изменяемым-подстраиваемым) от общей энергии (сумма всех компонент физического спектра) то осталось проверить наличие 2-ой и третьей гармоники. Если такой компоненты нет - методом исключения - сигнал шумоподобный. Экономим кучу нервов и MIPS'ов  . 2 SPACUM: Вы уж не серчайте, что я так о Вас - мол, программист от матлаба. Просто бывают и такие. Кому математический формализм важнее физической реализации. И 100% и такие нужны... Но... Как видите в предложенной мной схеме не нужно мерять шум возводя отсчеты в квадрат - экономим сотни MIPS'ов но не противоречим здравому смыслу.
--------------------
Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...
|
|
|
|
|
Jul 4 2011, 06:19
|
Участник

Группа: Участник
Сообщений: 22
Регистрация: 1-07-11
Пользователь №: 66 006

|
Цитата(DRUID3 @ Jul 3 2011, 03:09)  Педыдущего если иди сверху? А если серьезнее - не знаю какой там алгоритм, но ваши пункты мало соответствуют тем строчкам на английском языке. что Вы привели. Потому - не знаю что и думать. До меня программист писал - как он объяснил, таким методом он в жизни струны настраивает. Может, я его неправильно понял, не знаю - просто музыкального слуха у меня нет, гитару настроить не смогу никогда. Я потестил - впечатление, что действительно не нужен пункт с проверкой вершин относительно "сигнального уровня". Цитата(DRUID3 @ Jul 3 2011, 03:09)  ...а я бы оконные функции выбросил. Размен улучшения разрешения по частоте на уменьшение разрешения по времени(по- сути потерю "энергетики") не оправдывает себя для поиска основного тона. И метрология здесь ни к чему, мало того с окнами она ложная. Тестеры разберутся, что оптимальнее. Нужно будет - поставим прямоугольное окно. Цитата(DRUID3 @ Jul 3 2011, 03:09)  Гы... Прикол. Не забудьте еще частоту дискретизации 8000 выставить, а то наваяете... А какая "ява"? "Наша" или "андроидная"? Андроидная Ява, да. С 8000 уже столкнулся - решил проверить, что будет, если увеличить частоту дискретизации вдвое. А действительно, почему так? Что произошло? Цитата(DRUID3 @ Jul 3 2011, 03:09)  Я бы делал так: 1) скользящее среднее проверяет наличие звуковой активности(т.к. блок>>фонемы). 2) автокоррелятор проверяет шумовой ли сигнал (единственный пик на 0-е) или колебательный(периодическая автокорреляционная функция). Ну и находим основную частоту - 1/период_автокорреляционной_функции . ))))))) . Но этот путь жрет много ресурсов. Можно автокорреляцию аппроксимировать конечно. Шагать непосэмплово. Но это трудный путь )))... ...тогда так: 1) скользящее среднее проверяет наличие звуковой активности(т.к. блок>>фонемы). 2) если есть активность, то RealFFT начиная с момента активности. 3) Получение быстрой оценки физического спектра - Р.Лайонс ст.475 4) Получить массив указателей на массив значений физического спектра. Ну не знаю как там в Java придумаете. Нужно чтобы и номера отсчетов первоначального спектра остались и отсортированный их массив был. Ну а далее техническое творчество. Если наибольший спектральный компонент не на нулевой частоте и содержит ощутимую часть(вот этот бы порог сделать изменяемым-подстраиваемым) от общей энергии (сумма всех компонент физического спектра) то осталось проверить наличие 2-ой и третьей гармоники. Если такой компоненты нет - методом исключения - сигнал шумоподобный. Экономим кучу нервов и MIPS'ов  . Хух  Столько терминов, что у ученика перегрузка мозга произошла  Спасибо!
|
|
|
|
|
Jul 4 2011, 07:03
|

山伏
    
Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294

|
Цитата(QuickNick @ Jul 4 2011, 09:19)  До меня программист писал ... У Вас английский "внутрикорпоратив"? Цитата(QuickNick @ Jul 4 2011, 09:19)  Тестеры разберутся, что оптимальнее. Нужно будет - поставим прямоугольное окно. ...им не пофиг? Цитата(QuickNick @ Jul 4 2011, 09:19)  Андроидная Ява, да. Ха... а что там есть из звукового API? Цитата(QuickNick @ Jul 4 2011, 09:19)  С 8000 уже столкнулся - решил проверить, что будет, если увеличить частоту дискретизации вдвое. А действительно, почему так? Что произошло? Х.з.  ... а если серьезнее - я вообще о том, что нужно выставлять 8000 во всех приложениях связанных с голосом иначе оверхед - ну там 44100 например. А не заработало у Вас скорее всего из-за того, что звуковушка там 16000 не поддерживает. Цитата(QuickNick @ Jul 4 2011, 09:19)  Хух  Столько терминов, что у ученика перегрузка мозга произошла  Скользящее среднее тотже Лайонс ст.398. RealFFT кажется есть в API "андроида"... "квиксорт" тоже должен быть. А о автокорреляторе просто пока забудьте. Цитата(QuickNick @ Jul 4 2011, 09:19)  Спасибо!  Стоп, а деньги где? P.S.: ... простой проект по захвату звука в "андроиде"... Вдруг кому пригодиЦЦо...
--------------------
Нас помнят пока мы мешаем другим... //-------------------------------------------------------- Хороший блатной - мертвый... //-------------------------------------------------------- Нет старик, это те дроиды которых я ищу...
|
|
|
|
Сообщений в этой теме
QuickNick Алгоритм поиска основной частоты Jul 1 2011, 06:56 qxov Описано много всего. Зачем все это делается - не п... Jul 1 2011, 11:54 QuickNick Цитата(qxov @ Jul 1 2011, 14:54) Описано ... Jul 1 2011, 12:30     SPACUM Цитата(DRUID3 @ Jul 3 2011, 04:09) Вы уж ... Jul 3 2011, 16:59      DRUID3 Цитата(SPACUM @ Jul 3 2011, 19:59) Матлаб... Jul 3 2011, 21:28       QuickNick Цитата(DRUID3 @ Jul 4 2011, 10:03) У Вас ... Jul 4 2011, 07:42     QuickNick Цитата(DRUID3 @ Jul 3 2011, 03:09) Гы... ... Jul 4 2011, 12:30      SPACUM Цитата(QuickNick @ Jul 4 2011, 16:30) А н... Jul 5 2011, 20:17       QuickNick Цитата(SPACUM @ Jul 5 2011, 23:17) Пробов... Jul 6 2011, 06:37        SPACUM Цитата(QuickNick @ Jul 6 2011, 10:37) Бин... Jul 6 2011, 11:45         QuickNick Цитата(SPACUM @ Jul 6 2011, 14:45) Bin - ... Jul 6 2011, 13:58          SPACUM Цитата(QuickNick @ Jul 6 2011, 17:58) А. ... Jul 6 2011, 16:04           QuickNick Цитата(SPACUM @ Jul 6 2011, 19:04) res =(... Jul 14 2011, 07:03            SPACUM Цитата(QuickNick @ Jul 14 2011, 11:03) По... Jul 14 2011, 17:10             QuickNick Цитата(SPACUM @ Jul 14 2011, 20:10) 1.Есл... Jul 15 2011, 06:43              SPACUM Цитата(QuickNick @ Jul 15 2011, 10:43) За... Jul 15 2011, 08:22               QuickNick Цитата(SPACUM @ Jul 15 2011, 11:22) Если ... Jul 15 2011, 09:08              SPACUM Цитата(QuickNick @ Jul 15 2011, 10:43) Но... Jul 15 2011, 10:51               QuickNick Цитата(SPACUM @ Jul 15 2011, 13:51) Очень... Jul 15 2011, 12:01       QuickNick Цитата(SPACUM @ Jul 5 2011, 23:17) А макс... Jul 8 2011, 08:59        SPACUM Цитата(QuickNick @ Jul 8 2011, 12:59) 1)Е... Jul 8 2011, 21:15 DRUID3 Цитата(QuickNick @ Jul 1 2011, 09:56) 8. ... Jul 1 2011, 14:33 QuickNick 2 SPACUM: спасибо большое за помощь! Jul 11 2011, 06:38 thermit ЦитатаQuickNick:
Вот и нарвались на ступеньку sad.... Jul 14 2011, 10:25 QuickNick Цитата(thermit @ Jul 14 2011, 13:25) Явле... Jul 14 2011, 10:32 thermit ЦитатаSPACUM:
4.Явление Гиббса никакого отношения ... Jul 14 2011, 18:30 SPACUM Цитата(thermit @ Jul 14 2011, 22:30) Это ... Jul 14 2011, 19:57
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|