|
|
  |
Сравнение случайных величин |
|
|
|
Dec 6 2011, 11:42
|
Частый гость
 
Группа: Участник
Сообщений: 79
Регистрация: 15-06-10
Пользователь №: 57 933

|
Всем уважаемым форумчанам доброго дня! Никак не возьму в толк, как верно поступить. Делаю численный эксперимент. Есть истинное значение величины, положим 181 ( задаю сам для эксперимента). Суть эксперимента - найти наиболее подходящий метод обработки данных, дающий число, наиболее близкое к искомому ( к 180 то бишь). На выходе эксперимента имею три распределения (для трех разных алгоритмов) искомой величины.
. Первые 2 распределения имеют нормальный закон (по критерию Шапиро-Уилка), третье не соответствует нормальному распределению (по тому же критерию). СУТЬ ВОПРОСА: как, имея данные распределения и истинное значение величины, определить, какой из алгоритмов наиболее подходит для обработки данных?
|
|
|
|
|
Dec 6 2011, 11:57
|
Гуру
     
Группа: Свой
Сообщений: 3 020
Регистрация: 7-02-07
Пользователь №: 25 136

|
Цитата(bornbash @ Dec 6 2011, 15:42)  Суть эксперимента - найти наиболее подходящий метод обработки данных, дающий число, наиболее близкое к искомому ( к 180 то бишь). На выходе эксперимента имею три распределения (для трех разных алгоритмов) искомой величины. Что-то у Вас не доделано: нужно было получить число, а получили распределение. Цитата(bornbash @ Dec 6 2011, 15:42)  СУТЬ ВОПРОСА: как, имея данные распределения и истинное значение величины, определить, какой из алгоритмов наиболее подходит для обработки данных? Никак. Потому что неизвестно, что значит "наиболее подходит". Задача как-то совсем абстрактно сформулирована. Вы бы сказали, что за числа, откуда берутся. Было бы понятнее.
|
|
|
|
|
Dec 6 2011, 12:25
|
Частый гость
 
Группа: Участник
Сообщений: 79
Регистрация: 15-06-10
Пользователь №: 57 933

|
Цитата Что-то у Вас не доделано: нужно было получить число, а получили распределение. Можно было получить и число. Но я специально провожу серию экспериментов и получаю распределения, чтобы можно было говорить о статистических свойствах, например нечто вроде "алгоритм дает относительную погрешность определения величины не более 5% с вероятностью 0,95". Но с чем сравнивать истинное значение? С матожиданием? А у третьего распределения вообще закон под нормальный не подходит вроде как. Попробую еще проверить критерием хи-квадрат. Цитата Никак. Потому что неизвестно, что значит "наиболее подходит". Видимо, здесь надо говорить об относительных ошибках определения величины. Но как их вычислить??? Сравнивать истинное значение с матожиданием распределений некорректно!
|
|
|
|
|
Dec 6 2011, 12:42
|
Гуру
     
Группа: Свой
Сообщений: 3 020
Регистрация: 7-02-07
Пользователь №: 25 136

|
В начале я не совсем понял, что происходит. Цитата(bornbash @ Dec 6 2011, 16:25)  Видимо, здесь надо говорить об относительных ошибках определения величины. Но как их вычислить??? Разве не для этого используется дисперсия? Цитата(bornbash @ Dec 6 2011, 16:25)  Сравнивать истинное значение с матожиданием распределений некорректно! Интересно, почему? Вы по-прежнему не сказали, что значит "алгоритм подходит". Может оказаться, что они все подходят. Или ни один не подходит. Какой смысл теоретизировать? Кстати, можно комбинировать алгоритмы (скажем, брать среднее из трёх) и смотреть, станет ли лучше. Или эта задача к практике отношения не имеет? Тогда можно продолжать теоретизировать до бесконечности.
|
|
|
|
|
Dec 6 2011, 12:56
|
Гуру
     
Группа: Модераторы
Сообщений: 8 752
Регистрация: 6-01-06
Пользователь №: 12 883

|
Цитата(bornbash @ Dec 6 2011, 16:25)  Но с чем сравнивать истинное значение? С матожиданием? А у третьего распределения вообще закон под нормальный не подходит вроде как. Попробую еще проверить критерием хи-квадрат. Ваша третья картинка - пример N-модального распределения. И там тоже можно вычислять среднее, которое тоже можно вычислять разными способами. Сумма вес*число/сумма весов. А можно считать несколько средних со своей дисперсией. Основной вопрос стоит так - имеется (ли) априорная информация (или гипотеза) о получаемых данных. Например, третью картинку можно интерпретировать как выходное напряжение ЦАПа или, например, как масс-спектр, в котором мы (неожиданно?) обнаружили изотопы. Открыли. Но среднее значение, которое тоже можно вычислить, должно соответствовать молекулярной массе, которую используют химики.
|
|
|
|
|
Dec 6 2011, 13:24
|
Частый гость
 
Группа: Участник
Сообщений: 79
Регистрация: 15-06-10
Пользователь №: 57 933

|
to all Входными данными для всех трех "алгоритмов" являются значения функции взаимной корреляции. Собственно все это хозяйство призвано в конце концов дать ответ на вопрос "Какова задержка сигнала?" по ВКФ. Алгоритм - это слишком громко сказано было. Скорее способ. Один из способов (как раз третья гистограмма) - это классика - по максимуму ВКФ. Однако сама ВКФ имеет довольно сложный вид со множеством локальных максимумов, поэтому и пытаюсь оценить несколько способов. И спрашиваю, как понять, каким из способов наиболее оптимально можно вытащить из ВКФ величину задержки. to scifi Цитата Вы по-прежнему не сказали, что значит "алгоритм подходит". Проблема в том, что сам не могу понять, ЧТО использовать в качестве критерия оптимальности. Т.е. как соотнести истинное значение и те распределения, которые имею? PS: распределения в конце получаю, т.к. считаю много ВКФ при разных значения шума, накладываемого на сигнал. Шум - белый с норм законом распределения. Параметры шума (СКО и прочее) от эксперимента к эксперименту, естественно, не меняются.
Сообщение отредактировал bornbash - Dec 6 2011, 13:31
|
|
|
|
|
Dec 6 2011, 19:34
|
Частый гость
 
Группа: Участник
Сообщений: 79
Регистрация: 15-06-10
Пользователь №: 57 933

|
Цитата А сильно ли различаются величины локальных максимумов в бесшумном случае? Если достаточно сильно, что ответ вроде очевиден - берется максимальный максимум Ближайший к глобальному максимуму локальный максимум составляет 0,92 от глобального максимума в текущей ситуации, т.е. при наличии шумов. Остальные меньше. И обусловлены локальные максимумы не шумами, а тем, что полезный сигнал есть огибающая несущего синуса (который и дает сложную форму ВКФ). При этом амплитуда полезного сигнала сравнима с уровнем шумов и не позволяет её детектировать.
|
|
|
|
|
  |
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|