реклама на сайте
подробности

 
 
> Алгоритм поиска основной частоты, Метод максимального правдоподобия
QuickNick
сообщение Jul 1 2011, 06:56
Сообщение #1


Участник
*

Группа: Участник
Сообщений: 22
Регистрация: 1-07-11
Пользователь №: 66 006



Здравствуйте, товарищи.

Мне нужно улучшить алгоритм поиска основной частоты по методу максимального правдоподобия. Был пример у меня, как делать, я его модифицировал в нескольких местах (добавил настраиваемость оконной функции и фильтра). Возможно, некоторые места вам покажутся совершенно абсурдными - но я пока новичок в DSP, некоторые места в старом алгоритме вызывают у меня сильное удивление, но пока не хватает опыта для однозначного решения: или я не понимаю момент, или предыдущий программист допустил косяк.

- Вход: массив байтов byteData длиной sampleLength, количество разбиений sampleRate.
- Выход: фундаментальная частота fundamentalFrequency и громкость fundamentalVolume.

Алгоритм:
1. Массив байтов преобразуется в вешественный массив амплитуд.
2. Проверяется максимальная амплитуда - если она ниже определённого значения, то это квалифицируется как почти полная тишина (выход из алгоритма)
3. Получение спектра из массива амплитуд:
3.1. Умножение массива амплитуд на оконную функцию;
3.2. Преобразование Фурье.
4. Фильтрация массива спектральных значений.
5. Расчёт массива громкости (модуль от спектральных значений).
6. Нормализация громкости:
6.1. Поиск максимальной громкости (maxVolume).
6.2. Нормализация (volume[i] = volume[i]/maxVolume);
7. Квалификация спектра как информативного или зашумлённого.
8. Инициализация 3 пиков громкости и соответствующих им частот.
9. Поиск фундаментальной частоты.
9.1. Если один из 2 главных пиков громкости ниже некоторого порога громкости, то выбрать частоту другого главного пика, выход из алгоритма.
9.2. Поиск фундаментальной частоты по 2 главным пикам согласно известным пропорциям 1/2, 1/3, 2/3, 2/5, 3/4, 3/5.
9.3. Коррекция фундаментальной частоты по 3-му пику.

Мне нужно пробежаться по некоторым пунктам, чтобы удостовериться в валидности алгоритма.
Пункты 1, 2, 6, 8 и 9 вопросов не вызывают.

Самые горячие вопросы сейчас такие:
1. Правильно ли считается громкость? Массив спектральных значений имеет следующую структуру: в ячейках spectre[2*i] лежат коэффициэнты при косинусах, в spectre[2*i+1] лежат коэффициэнты при синусах. Соответственно, громкость считаю так: volume[i] = sqrt(sqr(spectre[2*i])+sqr(spectre[2*i+1])); Может, таким методом не громкость считается, а что-то другое?
2. Как рассчитать шум? И как рассчитать порог шума (если его превысить, то выход из алгоритма)? Сейчас шум рассчитывается как среднее арифметическое по массиву громкости.

Сообщение отредактировал QuickNick - Jul 1 2011, 07:00
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
SPACUM
сообщение Jul 1 2011, 13:58
Сообщение #2


Частый гость
**

Группа: Участник
Сообщений: 161
Регистрация: 22-06-09
Из: Москва
Пользователь №: 50 531



Цитата(QuickNick @ Jul 1 2011, 10:56) *
Мне нужно улучшить алгоритм поиска основной частоты

1.Во первыых терминология. До БПФ массив называется сигнал или выборка и алгоритм получения выборки не имеет отношения к заданным вопросам. После БПФ массив называется спектр, он комплексный Re и Im. После взятия корня из суммы квадратов получается массив амплитуд гармоник Фурье.
2.Термин "громкость" уже обсуждался и оказалось громкость = максимальная амплитуда.
3.На тему "поиск основной частоты" опубликовано множество работ и продолжает публиковаться. Это означает, что удовлетворяющий всех алгоритм не найден. Но существует множество приближений от самых простых приведенных в работах Куцукоса(Peter Kootsookos) до весьма сложных (Quinn, M. Macleod). Так что вполне можете придумать свой.
Можете поискать по словам "estimation" "estimation frequency" "funamental frequency" там много.
4.Рекомендую попробовать такой метод: Окно Гаусса->БПФ->Определить основные вершины->Уточнить вершины по трем точкам.
5.В измерении шума всегда используют критерий мощности. Возвести каждое значение сигнала в квадрат просуммировать разделить на количество и извлечь корень. Или возвести каждое значение амплитуды спектра в квадрат просуммировать и извлечь корень. (Делить не надо). Эти значения должны быть равны.


--------------------
Ты можешь знать все что угодно, но пока ты не доказал это на практике, ты не знаешь ничего!© Ричард Бах
Go to the top of the page
 
+Quote Post
QuickNick
сообщение Jul 1 2011, 14:56
Сообщение #3


Участник
*

Группа: Участник
Сообщений: 22
Регистрация: 1-07-11
Пользователь №: 66 006



Цитата(SPACUM @ Jul 1 2011, 16:58) *
1.Во первыых терминология. До БПФ массив называется сигнал или выборка и алгоритм получения выборки не имеет отношения к заданным вопросам. После БПФ массив называется спектр, он комплексный Re и Im. После взятия корня из суммы квадратов получается массив амплитуд гармоник Фурье.
2.Термин "громкость" уже обсуждался и оказалось громкость = максимальная амплитуда.

Ага, спасибо, пока ещё "плаваю" в терминологии.

Цитата(SPACUM @ Jul 1 2011, 16:58) *
5.В измерении шума всегда используют критерий мощности. Возвести каждое значение сигнала в квадрат просуммировать разделить на количество и извлечь корень. Или возвести каждое значение амплитуды спектра в квадрат просуммировать и извлечь корень. (Делить не надо). Эти значения должны быть равны.

То есть, "должны"?
Они обязательно будут равны или же "если равны, то ..."?
Допустим, я получил величину "корень из суммы квадратов амплитуд спектра". У неё какая размерность?
Если её поделить на максимальную амплитуду, то это можно будет использовать как некоторый порог шума?

Цитата(DRUID3 @ Jul 1 2011, 17:33) *
...бред какой-то )))... Вам нужно удостовериться, что главный пик это голос а потому имеет "ощутимую" 2-ую и третью гармоники...

В комментах предыдущих программист так написал:
Код
// If the volume is one of the 2-harmonics with maximum volume less than the threshold SIGNAL_LEVEL, it makes no sense to use to search for
// other harmonics of the fundamental frequency, because they are very weak, and perhaps are simply noise. Return as the fundamental frequency
// frequency with the maximum volume
Go to the top of the page
 
+Quote Post
DRUID3
сообщение Jul 1 2011, 15:19
Сообщение #4


山伏
*****

Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294



Цитата(QuickNick @ Jul 1 2011, 17:56) *
В комментах предыдущих программист так написал:
Код
// If the volume is one of the 2-harmonics with maximum volume less than the threshold SIGNAL_LEVEL, it makes no sense to use to search for
// other harmonics of the fundamental frequency, because they are very weak, and perhaps are simply noise. Return as the fundamental frequency
// frequency with the maximum volume

...что переводится так - "если высшие гармоники ниже шумового порога нет смысла их искать, они "потоплены" в шуме"... Вы же сделали совсем странные выводы...

Кстати, SPACUM, дает Вам не очень грамотные советы(относительно шума) - он, видимо, программист от матлаба. Хотя может Вам тоже прога для матлаба нужна?


--------------------
Нас помнят пока мы мешаем другим...
//--------------------------------------------------------
Хороший блатной - мертвый...
//--------------------------------------------------------
Нет старик, это те дроиды которых я ищу...
Go to the top of the page
 
+Quote Post
QuickNick
сообщение Jul 2 2011, 09:10
Сообщение #5


Участник
*

Группа: Участник
Сообщений: 22
Регистрация: 1-07-11
Пользователь №: 66 006



Цитата(DRUID3 @ Jul 1 2011, 18:19) *
...что переводится так - "если высшие гармоники ниже шумового порога нет смысла их искать, они "потоплены" в шуме"... Вы же сделали совсем странные выводы.

Таков алгоритм предыдущего программиста. Повторюсь, всё, что я изменил в нём - это сделал настраиваемость оконных функций и фильтров (в предыдущей версии они были "железно" прописаны).

Цитата(DRUID3 @ Jul 1 2011, 18:19) *
Кстати, SPACUM, дает Вам не очень грамотные советы(относительно шума) - он, видимо, программист от матлаба. Хотя может Вам тоже прога для матлаба нужна?

На Яве пишу.
Go to the top of the page
 
+Quote Post
DRUID3
сообщение Jul 3 2011, 00:09
Сообщение #6


山伏
*****

Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294



Цитата(QuickNick @ Jul 2 2011, 12:10) *
Таков алгоритм предыдущего программиста.

Педыдущего если иди сверху? А если серьезнее - не знаю какой там алгоритм, но ваши пункты мало соответствуют тем
строчкам на английском языке. что Вы привели. Потому - не знаю что и думать.

Цитата(QuickNick @ Jul 2 2011, 12:10) *
Повторюсь, всё, что я изменил в нём - это сделал настраиваемость оконных функций и фильтров (в предыдущей версии они
были "железно" прописаны).

...а я бы оконные функции выбросил. Размен улучшения разрешения по частоте на уменьшение разрешения по времени(по-
сути потерю "энергетики") не оправдывает себя для поиска основного тона. И метрология здесь ни к чему, мало того с
окнами она ложная.

Цитата(QuickNick @ Jul 2 2011, 12:10) *
На Яве пишу.

Гы... Прикол. Не забудьте еще частоту дискретизации 8000 выставить, а то наваяете... А какая "ява"? "Наша" или
"андроидная"?

Я бы делал так:

1) скользящее среднее проверяет наличие звуковой активности(т.к. блок>>фонемы).
2) автокоррелятор проверяет шумовой ли сигнал (единственный пик на 0-е) или колебательный(периодическая
автокорреляционная функция). Ну и находим основную частоту - 1/период_автокорреляционной_функции .
))))))) . Но этот путь жрет много ресурсов. Можно автокорреляцию аппроксимировать конечно. Шагать непосэмплово. Но
это трудный путь )))...

...тогда так:
1) скользящее среднее проверяет наличие звуковой активности(т.к. блок>>фонемы).
2) если есть активность, то RealFFT начиная с момента активности.
3) Получение быстрой оценки физического спектра - Р.Лайонс ст.475
4) Получить массив указателей на массив значений физического спектра. Ну не знаю как там в Java придумаете. Нужно
чтобы и номера отсчетов первоначального спектра остались и отсортированный их массив был. Ну а далее техническое
творчество. Если наибольший спектральный компонент не на нулевой частоте и содержит ощутимую часть(вот этот бы порог
сделать изменяемым-подстраиваемым) от общей энергии (сумма всех компонент физического спектра) то осталось проверить
наличие 2-ой и третьей гармоники. Если такой компоненты нет - методом исключения - сигнал шумоподобный. Экономим кучу нервов и MIPS'ов wink.gif .

2SPACUM:
Вы уж не серчайте, что я так о Вас - мол, программист от матлаба. Просто бывают и такие. Кому математический формализм важнее физической реализации. И 100% и такие нужны... Но... Как видите в предложенной мной схеме не нужно мерять шум возводя отсчеты в квадрат - экономим сотни MIPS'ов но не противоречим здравому смыслу.


--------------------
Нас помнят пока мы мешаем другим...
//--------------------------------------------------------
Хороший блатной - мертвый...
//--------------------------------------------------------
Нет старик, это те дроиды которых я ищу...
Go to the top of the page
 
+Quote Post
QuickNick
сообщение Jul 4 2011, 06:19
Сообщение #7


Участник
*

Группа: Участник
Сообщений: 22
Регистрация: 1-07-11
Пользователь №: 66 006



Цитата(DRUID3 @ Jul 3 2011, 03:09) *
Педыдущего если иди сверху? А если серьезнее - не знаю какой там алгоритм, но ваши пункты мало соответствуют тем
строчкам на английском языке. что Вы привели. Потому - не знаю что и думать.

До меня программист писал - как он объяснил, таким методом он в жизни струны настраивает. Может, я его неправильно понял, не знаю - просто музыкального слуха у меня нет, гитару настроить не смогу никогда.
Я потестил - впечатление, что действительно не нужен пункт с проверкой вершин относительно "сигнального уровня".

Цитата(DRUID3 @ Jul 3 2011, 03:09) *
...а я бы оконные функции выбросил. Размен улучшения разрешения по частоте на уменьшение разрешения по времени(по-
сути потерю "энергетики") не оправдывает себя для поиска основного тона. И метрология здесь ни к чему, мало того с
окнами она ложная.

Тестеры разберутся, что оптимальнее. Нужно будет - поставим прямоугольное окно.

Цитата(DRUID3 @ Jul 3 2011, 03:09) *
Гы... Прикол. Не забудьте еще частоту дискретизации 8000 выставить, а то наваяете... А какая "ява"? "Наша" или
"андроидная"?

Андроидная Ява, да.
С 8000 уже столкнулся - решил проверить, что будет, если увеличить частоту дискретизации вдвое.
А действительно, почему так?
Что произошло?

Цитата(DRUID3 @ Jul 3 2011, 03:09) *
Я бы делал так:

1) скользящее среднее проверяет наличие звуковой активности(т.к. блок>>фонемы).
2) автокоррелятор проверяет шумовой ли сигнал (единственный пик на 0-е) или колебательный(периодическая
автокорреляционная функция). Ну и находим основную частоту - 1/период_автокорреляционной_функции .
))))))) . Но этот путь жрет много ресурсов. Можно автокорреляцию аппроксимировать конечно. Шагать непосэмплово. Но
это трудный путь )))...

...тогда так:
1) скользящее среднее проверяет наличие звуковой активности(т.к. блок>>фонемы).
2) если есть активность, то RealFFT начиная с момента активности.
3) Получение быстрой оценки физического спектра - Р.Лайонс ст.475
4) Получить массив указателей на массив значений физического спектра. Ну не знаю как там в Java придумаете. Нужно
чтобы и номера отсчетов первоначального спектра остались и отсортированный их массив был. Ну а далее техническое
творчество. Если наибольший спектральный компонент не на нулевой частоте и содержит ощутимую часть(вот этот бы порог
сделать изменяемым-подстраиваемым) от общей энергии (сумма всех компонент физического спектра) то осталось проверить
наличие 2-ой и третьей гармоники. Если такой компоненты нет - методом исключения - сигнал шумоподобный. Экономим кучу нервов и MIPS'ов wink.gif .

Хух sm.gif Столько терминов, что у ученика перегрузка мозга произошла sm.gif

Спасибо!
Go to the top of the page
 
+Quote Post
DRUID3
сообщение Jul 4 2011, 07:03
Сообщение #8


山伏
*****

Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294



Цитата(QuickNick @ Jul 4 2011, 09:19) *
До меня программист писал ...

У Вас английский "внутрикорпоратив"?

Цитата(QuickNick @ Jul 4 2011, 09:19) *
Тестеры разберутся, что оптимальнее. Нужно будет - поставим прямоугольное окно.

...им не пофиг?

Цитата(QuickNick @ Jul 4 2011, 09:19) *
Андроидная Ява, да.

Ха... а что там есть из звукового API?

Цитата(QuickNick @ Jul 4 2011, 09:19) *
С 8000 уже столкнулся - решил проверить, что будет, если увеличить частоту дискретизации вдвое.
А действительно, почему так?
Что произошло?

Х.з. rolleyes.gif ... а если серьезнее - я вообще о том, что нужно выставлять 8000 во всех приложениях связанных с голосом иначе оверхед - ну там 44100 например. А не заработало у Вас скорее всего из-за того, что звуковушка там 16000 не поддерживает.

Цитата(QuickNick @ Jul 4 2011, 09:19) *
Хух sm.gif Столько терминов, что у ученика перегрузка мозга произошла sm.gif

Скользящее среднее тотже Лайонс ст.398. RealFFT кажется есть в API "андроида"... "квиксорт" тоже должен быть. А о автокорреляторе просто пока забудьте.

Цитата(QuickNick @ Jul 4 2011, 09:19) *
Спасибо!

blink.gif Стоп, а деньги где?

P.S.: ...простой проект по захвату звука в "андроиде"... Вдруг кому пригодиЦЦо...


--------------------
Нас помнят пока мы мешаем другим...
//--------------------------------------------------------
Хороший блатной - мертвый...
//--------------------------------------------------------
Нет старик, это те дроиды которых я ищу...
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- QuickNick   Алгоритм поиска основной частоты   Jul 1 2011, 06:56
- - qxov   Описано много всего. Зачем все это делается - не п...   Jul 1 2011, 11:54
|- - QuickNick   Цитата(qxov @ Jul 1 2011, 14:54) Описано ...   Jul 1 2011, 12:30
|- - SPACUM   Цитата(DRUID3 @ Jul 3 2011, 04:09) Вы уж ...   Jul 3 2011, 16:59
||- - DRUID3   Цитата(SPACUM @ Jul 3 2011, 19:59) Матлаб...   Jul 3 2011, 21:28
||- - QuickNick   Цитата(DRUID3 @ Jul 4 2011, 10:03) У Вас ...   Jul 4 2011, 07:42
|- - QuickNick   Цитата(DRUID3 @ Jul 3 2011, 03:09) Гы... ...   Jul 4 2011, 12:30
|- - SPACUM   Цитата(QuickNick @ Jul 4 2011, 16:30) А н...   Jul 5 2011, 20:17
|- - QuickNick   Цитата(SPACUM @ Jul 5 2011, 23:17) Пробов...   Jul 6 2011, 06:37
||- - SPACUM   Цитата(QuickNick @ Jul 6 2011, 10:37) Бин...   Jul 6 2011, 11:45
||- - QuickNick   Цитата(SPACUM @ Jul 6 2011, 14:45) Bin - ...   Jul 6 2011, 13:58
||- - SPACUM   Цитата(QuickNick @ Jul 6 2011, 17:58) А. ...   Jul 6 2011, 16:04
||- - QuickNick   Цитата(SPACUM @ Jul 6 2011, 19:04) res =(...   Jul 14 2011, 07:03
||- - SPACUM   Цитата(QuickNick @ Jul 14 2011, 11:03) По...   Jul 14 2011, 17:10
||- - QuickNick   Цитата(SPACUM @ Jul 14 2011, 20:10) 1.Есл...   Jul 15 2011, 06:43
||- - SPACUM   Цитата(QuickNick @ Jul 15 2011, 10:43) За...   Jul 15 2011, 08:22
|||- - QuickNick   Цитата(SPACUM @ Jul 15 2011, 11:22) Если ...   Jul 15 2011, 09:08
||- - SPACUM   Цитата(QuickNick @ Jul 15 2011, 10:43) Но...   Jul 15 2011, 10:51
||- - QuickNick   Цитата(SPACUM @ Jul 15 2011, 13:51) Очень...   Jul 15 2011, 12:01
|- - QuickNick   Цитата(SPACUM @ Jul 5 2011, 23:17) А макс...   Jul 8 2011, 08:59
|- - SPACUM   Цитата(QuickNick @ Jul 8 2011, 12:59) 1)Е...   Jul 8 2011, 21:15
- - DRUID3   Цитата(QuickNick @ Jul 1 2011, 09:56) 8. ...   Jul 1 2011, 14:33
- - QuickNick   2 SPACUM: спасибо большое за помощь!   Jul 11 2011, 06:38
- - thermit   ЦитатаQuickNick: Вот и нарвались на ступеньку sad....   Jul 14 2011, 10:25
|- - QuickNick   Цитата(thermit @ Jul 14 2011, 13:25) Явле...   Jul 14 2011, 10:32
- - thermit   ЦитатаSPACUM: 4.Явление Гиббса никакого отношения ...   Jul 14 2011, 18:30
- - SPACUM   Цитата(thermit @ Jul 14 2011, 22:30) Это ...   Jul 14 2011, 19:57


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 17th June 2025 - 13:04
Рейтинг@Mail.ru


Страница сгенерированна за 0.02727 секунд с 7
ELECTRONIX ©2004-2016