реклама на сайте
подробности

 
 
> Мера близости последовательностей на основе взаимной корреляции
roman73_2
сообщение Oct 13 2014, 17:38
Сообщение #1





Группа: Новичок
Сообщений: 3
Регистрация: 13-10-14
Пользователь №: 83 123



Есть две числовые последовательности (времянных ряда, одномерных сигнала и т.д.), с немного разной длиной.
Нужно придумать меру их сходства, например от 0 до 1.

Можно последовательности интерполировать до одинаковой длины и найди ошибку (среднеквадратичную например). Это не совсем подходит, т.к. могут быть небольшие смещения.

Придумали эвристику на основе Левенштейна - цена замены - модуль разницы между сигналами. Как-то работает - но хочется сделать по науке sm.gif

Натолкнился на статью в википедии по взаимной корреляции
https://ru.wikipedia.org/wiki/%D0%92%D0%B7%...%86%D0%B8%D1%8F

Там описано, как из двух последовательностей получить результирующую (алгоритм похож на вычисление свёртки), это понятно. А как из этой последовательности получить число, которое говорило бы - похожи сигналы или нет?

Заранее спасибо.

Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Xenia
сообщение Oct 13 2014, 18:34
Сообщение #2


Гуру
******

Группа: Модератор FTP
Сообщений: 4 479
Регистрация: 20-02-08
Из: Москва
Пользователь №: 35 237



Цитата(roman73_2 @ Oct 13 2014, 21:38) *
Есть две числовые последовательности (времянных ряда, одномерных сигнала и т.д.), с немного разной длиной.
Нужно придумать меру их сходства, например от 0 до 1.


Меру сходства придумать недолго, однако далеко не любая мера имеет физический смысл. Например, даже в том случае, когда обе числовые последовательности одной длины, корреляция, вычисленная традиционным способом (как косинус угла между векторами в N-мерном пространстве) может не иметь ничего общего с правдой, если в первой последовательности поминутные отсчеты, а во второй посекундные.

Т.е. в общем случае формально-математически методы расчета корреляции имеют смысл, только если имеет место строгое соответствие между элементами первой последовательности и второй, даже если это соответствие неизвестно. В противном случае задача на взаимную корреляцию вообще не имеет смысла.

Подобного рода задачи часто возникают в генетике, когда требуется оценить родство геномов или отдельных генов, принадлежащих к разным видам живых организмов или их предполагаемым предкам. При этом очень часто оказывается, что эти гены (являющиеся в математическом смысле тоже последовательностями) неравной длины, а то и зачастую имеют в своем составе делеции (пропуск одного элемента) и/или вставки (добавление лишнего элемента) в произвольном месте последовательности. А при равном числе делеций и вставок может и длина совпадать, однако традиционными методами считать корреляцию тут все равно нельзя, т.к. после прохождения пропущенного или вставленного звена наступает десинхронизация. Это фактически тот же случай, когда пытаются сравнить две бинарные прошивки МК побайтовым сравнением sm.gif.

Из того инструментария, который применяется в таких случаях, могу посоветовать взаимную (кросс-)корреляцию со сдвигом. Это близкий родственник свертки двух функций, когда более короткая последовательно прикладывается к более длинной в разных местах последней. Т.е. сперва нос-к-носу, потом со сдвигом на одно звено, затем на два и т.д., пока не совпадут хвосты обеих последовательностей. А за меру сходства принимается максимальный результат из всех этих сдвиговых корреляцией.
Go to the top of the page
 
+Quote Post
roman73_2
сообщение Oct 13 2014, 20:18
Сообщение #3





Группа: Новичок
Сообщений: 3
Регистрация: 13-10-14
Пользователь №: 83 123



Цитата(Xenia @ Oct 13 2014, 21:34) *
Меру сходства придумать недолго, однако далеко не любая мера имеет физический смысл. Например, даже в том случае, когда обе числовые последовательности одной длины, корреляция, вычисленная традиционным способом (как косинус угла между векторами в N-мерном пространстве) может не иметь ничего общего с правдой, если в первой последовательности поминутные отсчеты, а во второй посекундные.

Т.е. в общем случае формально-математически методы расчета корреляции имеют смысл, только если имеет место строгое соответствие между элементами первой последовательности и второй, даже если это соответствие неизвестно. В противном случае задача на взаимную корреляцию вообще не имеет смысла.

Подобного рода задачи часто возникают в генетике, когда требуется оценить родство геномов или отдельных генов, принадлежащих к разным видам живых организмов или их предполагаемым предкам. При этом очень часто оказывается, что эти гены (являющиеся в математическом смысле тоже последовательностями) неравной длины, а то и зачастую имеют в своем составе делеции (пропуск одного элемента) и/или вставки (добавление лишнего элемента) в произвольном месте последовательности. А при равном числе делеций и вставок может и длина совпадать, однако традиционными методами считать корреляцию тут все равно нельзя, т.к. после прохождения пропущенного или вставленного звена наступает десинхронизация. Это фактически тот же случай, когда пытаются сравнить две бинарные прошивки МК побайтовым сравнением sm.gif.

Вот не надо про гены и бинарные прошивки. Мне кажется я нормально описал задачу. Последовательности числовые, могут "немного" различаться масштабом (по x и/или по y), может быть сдвиг.

Цитата(Xenia @ Oct 13 2014, 21:34) *
Из того инструментария, который применяется в таких случаях, могу посоветовать взаимную (кросс-)корреляцию со сдвигом. Это близкий родственник свертки двух функций, когда более короткая последовательно прикладывается к более длинной в разных местах последней. Т.е. сперва нос-к-носу, потом со сдвигом на одно звено, затем на два и т.д., пока не совпадут хвосты обеих последовательностей. А за меру сходства принимается максимальный результат из всех этих сдвиговых корреляцией.

Спасибо, это уже ближе к телу. А формул не подкинете? Как в этом случае вычисляется сходство сдвинутых последовательностей, скалярное произведение? Или скреднеквадратичное отклонение?

Насколько я понял, элемент взаимнокорреляционного полинома (как и свёртки) складывается из многих элементов исходных последовательностей. И может быстро вычисляться через БПФ.
Вы кажется предлагаете какое-то попарное сравнение с перебором. Это не подходит. Сигнал может быть визуально сходен, но при попарном сравнении будет каша из-за разнице в масштабах по x. Или может я чего недопонял...
Я спрашиваю, как получить из взаимнокорреляционного полинома некоторую числовую меру сходства.

Другие идеи сравнения я не отметаю, но хотелось бы чего-нибудь математически обоснованного sm.gif
Go to the top of the page
 
+Quote Post
Dr.Alex
сообщение Oct 13 2014, 21:32
Сообщение #4


Профессионал
*****

Группа: Свой
Сообщений: 1 386
Регистрация: 5-04-05
Из: моська, RF
Пользователь №: 3 863



"Мера сходства" зависит от статистики искажений ваших последовательностей.

Если (и только тогда!) искажение — это AWGN, то корреляция и будет лучшей "мерой".

Если статистика другая, то и "мера" должна быть другая, И ОНА ОБЯЗАТЕЛЬНО ЗАВИСИТ ОТ СТАТИСТИКИ!
Go to the top of the page
 
+Quote Post
Дмитриос
сообщение Oct 15 2014, 18:48
Сообщение #5


Участник
*

Группа: Участник
Сообщений: 19
Регистрация: 22-04-10
Пользователь №: 56 826



Цитата(Dr.Alex @ Oct 14 2014, 01:32) *
"Мера сходства" зависит от статистики искажений ваших последовательностей.

Если (и только тогда!) искажение — это AWGN, то корреляция и будет лучшей "мерой".

Если статистика другая, то и "мера" должна быть другая, И ОНА ОБЯЗАТЕЛЬНО ЗАВИСИТ ОТ СТАТИСТИКИ!

Всегда интересовался вопросом но не смог найти ответ в умных книжках, какая мера нужна если шум не AWGN, то есть обычно в радиочастотных книжках пишут -- типа шум белый и всё тут laughing.gif -- поэтому оптимальный фильтр или приём сигнала -- это корреляция с самим сигналом, а если шум не белый?? sad.gif
а например:
1. синусойда (но заранее не знаешь фазу, а частоту знаешь плюс минут 20 процентов)
2. или если шум это ШИМ-сигнал который эту синусойду должен генерировать?
3. обобщая или может упрощая -- что если шум в узком спектре, и накладывается на широкополосный сигнал, то есть сигнал -- все цвета радуги а шум -- какой то сигнал в жёлтой части?

Понятно, что можно увиличить соотношение С/Ш задавить фильтром полосу шума но вместе с полосой мы и сам полезный сигнал давим -- но если шум он не цветной, а имеет более-менее известную форму -- можно же как то априори зная не только что шум не белый, а имеет определённую форму, обойтись не фильтрами заграждаюшими, а каким то более полезным критерием?



подскажите ссылки или книжки пожалуйста....

Сообщение отредактировал Дмитриос - Oct 15 2014, 18:56
Go to the top of the page
 
+Quote Post
Dr.Alex
сообщение Oct 15 2014, 21:16
Сообщение #6


Профессионал
*****

Группа: Свой
Сообщений: 1 386
Регистрация: 5-04-05
Из: моська, RF
Пользователь №: 3 863



Цитата(Дмитриос @ Oct 15 2014, 22:48) *
подскажите ссылки или книжки пожалуйста....


Не могу, общий случай сложен и при этом далековат от практики.. :-))

Точно можно сказать одно:: если шум не AWGN, то оптимальный приёмник будет нелинейным (корреляционный приёмник, напротив, линеен).

А во всех трёх ваших случаях решение известно, называется обеляющий фильтр. Он работает примерно как вы и говорите - давит те места в спектре, где стоят помехи с высокой спектральной плотностью, давит вместе с сигналом, естественно. Но тем не менее приёмник на основе обеляющего фильтра является оптимальным для узкополосных помех + AWGN. Это доказано ещё Котельниковым в работе "Теория потенциальной помехоустойчивости"..
Go to the top of the page
 
+Quote Post
Дмитриос
сообщение Oct 16 2014, 15:15
Сообщение #7


Участник
*

Группа: Участник
Сообщений: 19
Регистрация: 22-04-10
Пользователь №: 56 826



Цитата(Dr.Alex @ Oct 16 2014, 01:16) *
Не могу, общий случай сложен и при этом далековат от практики.. :-))

Спасибо за совет, однако хочется ещё подискутировать и предложить такой менее "сферическйи в ваккуме" пример: Умеется звуковая схема на которую воздействует помеха от сети, и мне доступен только её выход в котором присутвует полезный сигнал и сетевая помеха, могу ли я каким либо путём повысить соотношение С/Ш, ведь практически я могу подключится через резисторы к 220 вольтам и снимать сигнал с сети(в которой помимо 50 герцовой составляюшей есть ещё кратные гармоники а если двигатель асинхронный включён то и частота проскальзывания присутвует (45...49) герц.

1. То есть в случае с обеляюшим фильтром я вынужден вырезать 45...51 герц 100 герц 150 герц и так далее. Однако на практике есть конкретная информация о помехе. Некоторое пространство состояний которое вырезает обеляющий фильтр гораздо шире чем текущий сигнал помехи.

2. Лично мне, не очень опытному теоретику и практику, приходит на ум способ вычитания сигнала от розетки с каким-то коэффициентом и фазовым сдвигом -- сложный фильтр помехи который некоторой автоподстройкой узнаёт сдвиг фазы и амплитуду помехи и потом делает вычитание... то есть схема такая:
сигнал от разетки --> автоподстроечный фильтр --> вычитание входного сигнала и выхода фильтра --> схема обучения фильтра минимизурующая шум

Сообщение отредактировал Дмитриос - Oct 16 2014, 15:18
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- roman73_2   Мера близости последовательностей на основе взаимной корреляции   Oct 13 2014, 17:38
|||- - Dr.Alex   Вообще это адаптивным фильтром делается, описано в...   Oct 16 2014, 17:47
||- - andyp   Цитата(Дмитриос @ Oct 15 2014, 22:48) под...   Oct 16 2014, 08:19
|- - Xenia   Цитата(roman73_2 @ Oct 14 2014, 00:18) Во...   Oct 13 2014, 21:41
- - asoharev   Иногда для сравнения последовательностей (например...   Oct 14 2014, 20:33
|- - roman73_2   Цитата(asoharev @ Oct 15 2014, 00:33) Ино...   Oct 14 2014, 22:53
|- - asoharev   Цитата(roman73_2 @ Oct 15 2014, 02:53) Да...   Oct 15 2014, 18:15
- - V_G   Вообще-то ДО математики надо для себя понять, что ...   Oct 14 2014, 23:23
- - WitFed   Да, неужели нельзя настроить АЦП при приёме второй...   Oct 15 2014, 11:32
- - mvb   А можно побольше описания физики процесса? Что за ...   Oct 17 2014, 13:15


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 27th June 2025 - 23:04
Рейтинг@Mail.ru


Страница сгенерированна за 0.01415 секунд с 7
ELECTRONIX ©2004-2016