Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Сравнение случайных величин
Форум разработчиков электроники ELECTRONIX.ru > Cистемный уровень проектирования > Математика и Физика
bornbash
Всем уважаемым форумчанам доброго дня!
Никак не возьму в толк, как верно поступить. Делаю численный эксперимент. Есть истинное значение величины, положим 181 ( задаю сам для эксперимента). Суть эксперимента - найти наиболее подходящий метод обработки данных, дающий число, наиболее близкое к искомому ( к 180 то бишь). На выходе эксперимента имею три распределения (для трех разных алгоритмов) искомой величины.
Нажмите для просмотра прикрепленного файла.
Первые 2 распределения имеют нормальный закон (по критерию Шапиро-Уилка), третье не соответствует нормальному распределению (по тому же критерию). СУТЬ ВОПРОСА: как, имея данные распределения и истинное значение величины, определить, какой из алгоритмов наиболее подходит для обработки данных?
scifi
Цитата(bornbash @ Dec 6 2011, 15:42) *
Суть эксперимента - найти наиболее подходящий метод обработки данных, дающий число, наиболее близкое к искомому ( к 180 то бишь). На выходе эксперимента имею три распределения (для трех разных алгоритмов) искомой величины.

Что-то у Вас не доделано: нужно было получить число, а получили распределение.

Цитата(bornbash @ Dec 6 2011, 15:42) *
СУТЬ ВОПРОСА: как, имея данные распределения и истинное значение величины, определить, какой из алгоритмов наиболее подходит для обработки данных?

Никак. Потому что неизвестно, что значит "наиболее подходит".

Задача как-то совсем абстрактно сформулирована. Вы бы сказали, что за числа, откуда берутся. Было бы понятнее.
bornbash
Цитата
Что-то у Вас не доделано: нужно было получить число, а получили распределение.

Можно было получить и число. Но я специально провожу серию экспериментов и получаю распределения, чтобы можно было говорить о статистических свойствах, например нечто вроде "алгоритм дает относительную погрешность определения величины не более 5% с вероятностью 0,95". Но с чем сравнивать истинное значение? С матожиданием? А у третьего распределения вообще закон под нормальный не подходит вроде как. Попробую еще проверить критерием хи-квадрат.
Цитата
Никак. Потому что неизвестно, что значит "наиболее подходит".

Видимо, здесь надо говорить об относительных ошибках определения величины. Но как их вычислить??? Сравнивать истинное значение с матожиданием распределений некорректно!
scifi
В начале я не совсем понял, что происходит.

Цитата(bornbash @ Dec 6 2011, 16:25) *
Видимо, здесь надо говорить об относительных ошибках определения величины. Но как их вычислить???

Разве не для этого используется дисперсия?

Цитата(bornbash @ Dec 6 2011, 16:25) *
Сравнивать истинное значение с матожиданием распределений некорректно!

Интересно, почему?

Вы по-прежнему не сказали, что значит "алгоритм подходит". Может оказаться, что они все подходят. Или ни один не подходит. Какой смысл теоретизировать? Кстати, можно комбинировать алгоритмы (скажем, брать среднее из трёх) и смотреть, станет ли лучше.
Или эта задача к практике отношения не имеет? Тогда можно продолжать теоретизировать до бесконечности.
Tanya
Цитата(bornbash @ Dec 6 2011, 16:25) *
Но с чем сравнивать истинное значение? С матожиданием? А у третьего распределения вообще закон под нормальный не подходит вроде как. Попробую еще проверить критерием хи-квадрат.

Ваша третья картинка - пример N-модального распределения. И там тоже можно вычислять среднее, которое тоже можно вычислять разными способами. Сумма вес*число/сумма весов. А можно считать несколько средних со своей дисперсией.
Основной вопрос стоит так - имеется (ли) априорная информация (или гипотеза) о получаемых данных. Например, третью картинку можно интерпретировать как выходное напряжение ЦАПа или, например, как масс-спектр, в котором мы (неожиданно?) обнаружили изотопы. Открыли. Но среднее значение, которое тоже можно вычислить, должно соответствовать молекулярной массе, которую используют химики.
bornbash
to all
Входными данными для всех трех "алгоритмов" являются значения функции взаимной корреляции. Собственно все это хозяйство призвано в конце концов дать ответ на вопрос "Какова задержка сигнала?" по ВКФ. Алгоритм - это слишком громко сказано было. Скорее способ. Один из способов (как раз третья гистограмма) - это классика - по максимуму ВКФ. Однако сама ВКФ имеет довольно сложный вид со множеством локальных максимумов, поэтому и пытаюсь оценить несколько способов. И спрашиваю, как понять, каким из способов наиболее оптимально можно вытащить из ВКФ величину задержки.
to scifi
Цитата
Вы по-прежнему не сказали, что значит "алгоритм подходит".

Проблема в том, что сам не могу понять, ЧТО использовать в качестве критерия оптимальности. Т.е. как соотнести истинное значение и те распределения, которые имею?

PS: распределения в конце получаю, т.к. считаю много ВКФ при разных значения шума, накладываемого на сигнал. Шум - белый с норм законом распределения. Параметры шума (СКО и прочее) от эксперимента к эксперименту, естественно, не меняются.
AlexeyW
Цитата(bornbash @ Dec 6 2011, 17:24) *
Однако сама ВКФ имеет довольно сложный вид со множеством локальных максимумов, поэтому и пытаюсь оценить несколько способов.

А сильно ли различаются величины локальных максимумов в бесшумном случае? Если достаточно сильно, что ответ вроде очевиден - берется максимальный максимум sm.gif
bornbash
Цитата
А сильно ли различаются величины локальных максимумов в бесшумном случае? Если достаточно сильно, что ответ вроде очевиден - берется максимальный максимум

Ближайший к глобальному максимуму локальный максимум составляет 0,92 от глобального максимума в текущей ситуации, т.е. при наличии шумов. Остальные меньше. И обусловлены локальные максимумы не шумами, а тем, что полезный сигнал есть огибающая несущего синуса (который и дает сложную форму ВКФ). При этом амплитуда полезного сигнала сравнима с уровнем шумов и не позволяет её детектировать.
AlexeyW
Цитата(bornbash @ Dec 6 2011, 23:34) *
что полезный сигнал есть огибающая несущего синуса (который и дает сложную форму ВКФ).

Примерно так я и подумал, это довольно классический случай.. Я попробую вспомнить что-то разумное, что у меня есть по этой теме - приходилось этим заниматься, но давно.
bornbash
AlexeyW
Спасибо, жду sm.gif
AlexeyW
Да рано спасибо sm.gif Еще вопрос, получится ли что-то реально полезное нарыть.
Дмитрий_Б
Если речь идёт о классической задаче оценивания задержки сигнала в присутствии белого шума, то ответ тривиальный: найти максимум взаимно-корреляционной функции. Совет: ищите максимум модуля комплексной огибающей. Её можно получить по-разному. Например, с помощью преобразования Гильберта от уже вычисленной Вами взаимно-корреляционной функции - для получения мнимой части.
bornbash
to Дмитрий_Б
Могли бы Вы чуть подробнее пояснить физическую суть комплексной огибающей в ВКФ? При квадратурном модулировании/демодулировании ясно, когда говорят о комплексной огибающей, а в моем случае не вполне...
bornbash
К сожалению, ситуация не прояснилась.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.