|
Вычисление дисперсии на лету, Возможно ли |
|
|
|
 |
Ответов
|
Jan 25 2008, 00:09
|
Местный
  
Группа: Свой
Сообщений: 462
Регистрация: 26-06-07
Пользователь №: 28 723

|
Цитата(vladv @ Jan 25 2008, 02:54)  Интересно, а насколько несмещенная такая оценка дисперсии? Вот, например, для накопленных n выборок несмещенной оценкой дисперсии будет: D = sum((X[n]-m)^2) / (n-1) а не, что кажется естественным: D = sum((X[n]-m)^2) / n Не вопрос, просто вводится поправочный множитель n/(n-1)
|
|
|
|
|
Jan 25 2008, 23:23
|
Частый гость
 
Группа: Участник
Сообщений: 128
Регистрация: 7-06-06
Пользователь №: 17 825

|
Цитата(SIA @ Jan 25 2008, 03:09)  Не вопрос, просто вводится поправочный множитель n/(n-1) Не, вопрос в том, смещена эта оценка или не смещена (я имею ввиду формулы, которые NickNich в посте #10 привел). Цитата(NickNich @ Jan 25 2008, 12:12)  Это асимтотически несмещенная оценка, т.е. при вычислении диспрерсии по конечной выборке результат имеет смещение, которое стремится к нулю при учеличении длины выборки. При больших длинах разницы между множителями 1/N и 1/(N-1) практически нет... Ну так и "D = sum((X[n]-m)^2) / n" "асимптотически несмещенная"... А как насчет смещения (или несмещения) для конкретного N? Цитата(NickNich @ Jan 25 2008, 18:47)  Выражение, которое привет TSerg, фактически, вычисляет оценки дисперсии по нескольким первым отсчетам, примерно по первым 20-ти. Обратите внимание, что множитель перед обновлением оценки дисперсии (квадрате разности) убывает обратно пропорционально номеру отсчета. Т.е. при каких-то значениях теущего номера обновления просто перестанут обновлять получившуюся оценку, в силу малости их весового коэффициента. Можно даже ввести эффективную длину входного потока, по которой вычисляется оценка лисперсии, сохранять это количество в буфер, а потом считать дисперсию по обычной формуле - так честнее получится  ... Цитата(NickNich @ Jan 25 2008, 18:47)  А я - нет. Я присал про убывание обновляющей поправки к дисперсии, т.е. вот об этой формуле
D[i]=((j-1)/j)*D[i-1] + (1/j)*(X[i] - m[i])^2
К выражению для мат.ожидания у меня вопросов нет. Если внимательно проследить "судьбу" первого "отсчета" (X[k] - m[k])^2, то для i-й оценки дисперсии он войдет с коффициентом 1/j - как и для последнего отсчета (X[k] - m[k])^2. Это верно вообще для всех отсчетов. I.e. в D[i] ВСЕ отсчеты (X[k]-m[k])^2 войдут с коэффициентом 1/j. Впрочем, даже в формуле D[i]=D[i-1] + (1/i)*(X[i] - m[i])^2 нельзя пренебрегать последними отсчетами, поскольку ряд 1/i расходится.
Сообщение отредактировал vladv - Jan 25 2008, 23:25
|
|
|
|
|
Jan 26 2008, 23:27
|
Местный
  
Группа: Свой
Сообщений: 375
Регистрация: 8-11-05
Пользователь №: 10 593

|
Цитата(vladv @ Jan 26 2008, 02:23)  Не, вопрос в том, смещена эта оценка или не смещена (я имею ввиду формулы, которые NickNich в посте #10 привел). Ну так и "D = sum((X[n]-m)^2) / n" "асимптотически несмещенная"... А как насчет смещения (или несмещения) для конкретного N? Тут нужно точно понимать смысл употребляемых терминов. "Смещение" оценки это разность между мат.ожиданием оценки и мат.ожиданием оцениваемой величины. Если эта разность равна нулю, то оценка несмещенная. Если эта разность не равна нулю - оценка смещенная. Если ненулевая разность убывает до нуля с увеличением числа обрабатываемых отсчетов - оценка асимтотически несмещенная. Вот в этих терминах, оценка дисперсии с множителем 1/(N-1) - несмещенная, оценка с множителем 1/N - асимтотически несмещенная. Случайная составляющая ошибки оценки дисперсии для конкретного N описываются дисперсией оценки дисперсии. Формулы из книжки - если истинное значение дисперсии равно D, то дисперсия оценки дисперсии для формулы с множителем 1/N: D1 = 2*(N-1)*D^2/N^2, для формулы с множителем 1/(N-1): D2 = 2*D^2/(N-1). ... Цитата Если внимательно проследить "судьбу" первого "отсчета" (X[k] - m[k])^2, Вот и проследите - полностью распишите формулу и удивитесь. Дело в том, что первый отсчет очитывается с оценкой мат.ожидания по одному отсчету, второй отсчет - с мат.ожиданием по двум отсчетам и т.д.
|
|
|
|
|
Jan 27 2008, 23:06
|
Частый гость
 
Группа: Участник
Сообщений: 128
Регистрация: 7-06-06
Пользователь №: 17 825

|
Цитата(NickNich @ Jan 27 2008, 02:27)  Тут нужно точно понимать смысл употребляемых терминов. "Смещение" оценки это разность между мат.ожиданием оценки и мат.ожиданием оцениваемой величины. Если эта разность равна нулю, то оценка несмещенная. Если эта разность не равна нулю - оценка смещенная. Если ненулевая разность убывает до нуля с увеличением числа обрабатываемых отсчетов - оценка асимтотически несмещенная. Вот в этих терминах, оценка дисперсии с множителем 1/(N-1) - несмещенная, оценка с множителем 1/N - асимтотически несмещенная. Случайная составляющая ошибки оценки дисперсии для конкретного N описываются дисперсией оценки дисперсии. Формулы из книжки - если истинное значение дисперсии равно D, то дисперсия оценки дисперсии для формулы с множителем 1/N: D1 = 2*(N-1)*D^2/N^2, для формулы с множителем 1/(N-1): D2 = 2*D^2/(N-1). Ну хорошо. С опередением "смещение оценки" и "асмиптотическое смещение оценки" разобрались. И с формулой из книжки несмещенной оценки для накопленных N выборок тоже все ясно. Но вот интересно понять, формула вычисления дисперсии на лету, которую Вы привели, дает смещенную или не смещенную оценку? ... Цитата(NickNich @ Jan 27 2008, 02:27)  Вот и проследите - полностью распишите формулу и удивитесь. Дело в том, что первый отсчет очитывается с оценкой мат.ожидания по одному отсчету, второй отсчет - с мат.ожиданием по двум отсчетам и т.д.  Чему удивиться? То, что каждый отсчет со своей оценкой матожидания обсчитывается - это очевидно. Только при чем здесь это? Мой комментарий относился исключительно к Вашей фразе, которая не верна: "Выражение, которое привет TSerg, фактически, вычисляет оценки дисперсии по нескольким первым отсчетам, примерно по первым 20-ти. Обратите внимание, что множитель перед обновлением оценки дисперсии (квадрате разности) убывает обратно пропорционально номеру отсчета. Т.е. при каких-то значениях теущего номера обновления просто перестанут обновлять получившуюся оценку, в силу малости их весового коэффициента.".
Сообщение отредактировал vladv - Jan 27 2008, 23:08
|
|
|
|
Сообщений в этой теме
hobgoblin Вычисление дисперсии на лету Jan 17 2008, 11:38 Alex255 Цитата(hobgoblin @ Jan 17 2008, 14:38) По... Jan 17 2008, 11:52 TSerg m[i] = (1-k)*m[i-1] + k*X[i]
k=1/i
D[i]=((j-1)/j)*... Jan 17 2008, 11:56 NickNich Цитата(hobgoblin @ Jan 17 2008, 14:38) По... Jan 23 2008, 17:28 SIA Цитата(NickNich @ Jan 23 2008, 20:28) Выч... Jan 23 2008, 19:52  vladv Цитата(SIA @ Jan 23 2008, 22:52) Не совсе... Jan 23 2008, 23:59   SIA Цитата(vladv @ Jan 24 2008, 02:59) Надо. ... Jan 24 2008, 01:16  NickNich Цитата(SIA @ Jan 23 2008, 22:52) Не совсе... Jan 24 2008, 11:16   TSerg Цитата(NickNich @ Jan 24 2008, 14:16) Дей... Jan 24 2008, 13:03    NickNich Цитата(TSerg @ Jan 24 2008, 16:03) Пробле... Jan 24 2008, 14:06     TSerg Цитата(NickNich @ Jan 24 2008, 17:06) Выр... Jan 25 2008, 08:05   SIA Цитата(NickNich @ Jan 24 2008, 14:16) Дей... Jan 24 2008, 14:31 TSerg Цитата(NickNich @ Jan 23 2008, 20:28)
Е... Jan 24 2008, 09:45 Konste первый момент, m1, он же мат. ожидание - сумма эле... Jan 24 2008, 10:13 NickNich Цитата(vladv @ Jan 25 2008, 02:54) Интере... Jan 25 2008, 09:12  TSerg Цитата(NickNich @ Jan 25 2008, 12:12) Есл... Jan 25 2008, 15:35   NickNich Цитата(TSerg @ Jan 25 2008, 18:35) Мне - ... Jan 25 2008, 15:47
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|