реклама на сайте
подробности

 
 
> Стат. обработка экспериментальных данных
emark
сообщение Jan 18 2007, 19:29
Сообщение #1


Участник
*

Группа: Участник
Сообщений: 34
Регистрация: 2-10-05
Пользователь №: 9 146



Никогда не занимался стат. обработкой экспериментальных данных.
Требуется помощь клуба smile.gif
Имется гауссовый (предположительно) канал передачи данных с
неизвестными параметрами (данные - битовый поток). Параметры
канала (в отсутствии сигнала) вычисляются при помощи статистической
обработки отсчетов шума. Предположим шум в канале имеет нормальное
распределение и стационарен (вопрос пока не в этом).
Передаваемый через канал сигнал обрабатывается декодером, подключенным
к выходу линейного тракта приемника и статистически обрабатывается.
Всего предано во время эксперимента 10e+8 бит данных. Вероятность битовой
ошибки составляет 10e-5. Необходимо получить 10е-14. Как вариант -
воспользоваться помехозащищенным кодированием.

Вопрос вот в чем.
10е-5 - это точечная оценка вероятности битовой ошибки
с доверительным интервалом при мере значимости 0.95 [1.043070e-05 9.587083e-06]
на статистики 10e+8.
Применив кодирование, я начинаю оценивать вероятности 10е-14 (с такой
вероятностью будут появляться не обнаруживаемые кодом комбинации),
но на той же статистике (10е+8) при точечной оценки вероятности буду иметь
доверительный интервал порядка [1.778455e-08, 5.622858e-21]. Доверительный
интервал считался через гауссовый интеграл.

Это означает, что мне катострофически не хватает статистики?

Вообще интересен следующий вопрос. Насколько состоятельно рассуждать
о событиях с вероятностями 10е-14 по собранной статистики 10е+8 при
идеальном нормальном источнике шума с неизвестными параметрами?
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
NickNich
сообщение Jan 19 2007, 10:43
Сообщение #2


Местный
***

Группа: Свой
Сообщений: 375
Регистрация: 8-11-05
Пользователь №: 10 593



Цитата(emark @ Jan 18 2007, 19:29) *
Насколько состоятельно рассуждать
о событиях с вероятностями 10е-14 по собранной статистики 10е+8 при
идеальном нормальном источнике шума с неизвестными параметрами?

Вообще не состоятельно. Вероятность события 10е-14 очень маленькая и на выборке в 10е+8 испытаний это событие может вообще не произойти. Если же произойдет одно событие, то его вероятность будет рассчитана как 10е-8. Если размер 10е+8 для Вас критичен, то увеличивайте количество реализаций такой длины и выполняйте стат. обработку по ансамблю реализаций.
Go to the top of the page
 
+Quote Post
Tanya
сообщение Jan 19 2007, 10:51
Сообщение #3


Гуру
******

Группа: Модераторы
Сообщений: 8 752
Регистрация: 6-01-06
Пользователь №: 12 883



Цитата(NickNich @ Jan 19 2007, 10:43) *
Вообще не состоятельно. Вероятность события 10е-14 очень маленькая и на выборке в 10е+8 испытаний это событие может вообще не произойти. Если же произойдет одно событие, то его вероятность будет рассчитана как 10е-8. Если размер 10е+8 для Вас критичен, то увеличивайте количество реализаций такой длины и выполняйте стат. обработку по ансамблю реализаций.

Трудно с Вами согласится. Вот возьмем монетку и бросим 1000 раз.
После этого нетрудно посчитать вероятность того, что подряд выпадет 10^10 орлов.
Go to the top of the page
 
+Quote Post
NickNich
сообщение Jan 19 2007, 10:58
Сообщение #4


Местный
***

Группа: Свой
Сообщений: 375
Регистрация: 8-11-05
Пользователь №: 10 593



Цитата(Tanya @ Jan 19 2007, 10:51) *
Трудно с Вами согласится. Вот возьмем монетку и бросим 1000 раз.
После этого нетрудно посчитать вероятность того, что подряд выпадет 10^10 орлов.

При подбрасывании монетки возможно два исхода - выпадение орла или решки. Перед экспериментом делается предположение, что вероятность выпадения орла - 1/2. По 1000 событий можно оценить вероятность выпадения орла. Ессно, с некоторым дов.интервалом. Чтобы уменьшить этот интервал монетку подбрасывали 42 тыс. раз (где-то читал). По этой оценке вероятности выпадения орла можно рассчитать оценку выпадения 10^10 орлов подряд, возведя вероятность в соответствующую степень.

Автор темы ставит обратную задачу - как проверить по одной реализации предположение о вероятности возникновения события. При той длине реализации, которую задал автор, можно проверить только события, вероятности которых много больше 10e-8. Причину я указал выше.
Go to the top of the page
 
+Quote Post
emark
сообщение Jan 20 2007, 11:49
Сообщение #5


Участник
*

Группа: Участник
Сообщений: 34
Регистрация: 2-10-05
Пользователь №: 9 146



Цитата(NickNich @ Jan 19 2007, 12:58) *
При подбрасывании монетки возможно два исхода - выпадение орла или решки. Перед экспериментом делается предположение, что вероятность выпадения орла - 1/2. По 1000 событий можно оценить вероятность выпадения орла. Ессно, с некоторым дов.интервалом. Чтобы уменьшить этот интервал монетку подбрасывали 42 тыс. раз (где-то читал). По этой оценке вероятности выпадения орла можно рассчитать оценку выпадения 10^10 орлов подряд, возведя вероятность в соответствующую степень.

Автор темы ставит обратную задачу - как проверить по одной реализации предположение о вероятности возникновения события. При той длине реализации, которую задал автор, можно проверить только события, вероятности которых много больше 10e-8. Причину я указал выше.


Мне кажется, как раз легко сводится к моей задаче.

Пусть монета слегка кривовата. Форму распределения плотности вероятности мы знаем, не знаем только параметр учитывающия кривизну монеты (как у меня гаусс с неизвестными параметрами). Набираем статистику 10е+3, получаем некий результат, предположим 0.499, находим доверительный интервал - [5.299342e-01, 4.680735e-01] (И.Н.Бронштейн, К.А. Семедяев, "Справочник по математике" М.: Наука,1986,- 544 с., стр.459, 5.2.2.3.1 Доверительная оценка неизвестной вероятности по большим выборкам.)

Терерь сделаем точечную оценку вероятности выпадения 10^2 орлов подряд - 6.457354e-31
Находим доверительный интервал на статистике 10е+3 - [3.826758e-03, 1.085458e-58] Оппа...
Go to the top of the page
 
+Quote Post
NickNich
сообщение Jan 22 2007, 10:03
Сообщение #6


Местный
***

Группа: Свой
Сообщений: 375
Регистрация: 8-11-05
Пользователь №: 10 593



Цитата(emark @ Jan 20 2007, 11:49) *
Мне кажется, как раз легко сводится к моей задаче.


Как раз к Вашей задаче это отношения не имеет. Точнее, имеет отношение с точностью до наоборот. Вероятность события, состоящего в отсутствии выпадения орла в 1000 бросаний (т.е. выпадает только решка) равна 0.5^1000. Т.е. это практически невозможное событие. Вероятность того, что ошибка (с вероятностью появления p=10^-14) не реализуется внутри последовательности длиной N=10^8 равна
(1-p)^N~1-Np=0,999999. Т.е. Вы практически всегда будете получать отсутствие ошибки внутри реализации длиной N=10^8.

Глава книжки, которую Вы процитировали содержит слова "по большим выборкам". Вот для случая с монеткой выборка в 1000 испытаний - большая, а для случай с ошибкой в канале связи выборка в 10^8 испытаний не просто маленькая. Она ваще никакая...


Цитата(emark @ Jan 20 2007, 11:49) *
Находим доверительный интервал на статистике 10е+3 - [3.826758e-03, 1.085458e-58] Оппа...

Это бывает. Если Вы получили точечную оценку и доверительный инетрвал для какой-то реализации, то в соответствующую степень нужно возводить уже полученные границы инетрвала, а не считать их снова.
Go to the top of the page
 
+Quote Post
emark
сообщение Jan 22 2007, 12:37
Сообщение #7


Участник
*

Группа: Участник
Сообщений: 34
Регистрация: 2-10-05
Пользователь №: 9 146



Цитата(NickNich @ Jan 22 2007, 12:03) *
Цитата(emark @ Jan 20 2007, 11:49) *

Находим доверительный интервал на статистике 10е+3 - [3.826758e-03, 1.085458e-58] Оппа...

Это бывает. Если Вы получили точечную оценку и доверительный инетрвал для какой-то реализации, то в соответствующую степень нужно возводить уже полученные границы инетрвала, а не считать их снова.


Не понял.... что на что умножать (возводить) в моем случае?

Мне-то кажется вполне закономерно, что нижняя граница доверительного интервала (3.826758e-03) соотносится с накопленной статистикой. Вобщем-то, это подтверждает ваши выводы о нехватке статистики.

Цитата(NickNich @ Jan 22 2007, 11:49) *
Цитата(emark @ Jan 20 2007, 11:12) *

Дело в том, что при имеющихся ресурсах на это потребуется 300 лет

Чудес не бывает. В текущей реальности не существует хитрого алгоритма, позволяющего рассчитать вероятность редкого события по единственной реализации этого события.


Даже, если известен вид распределения плотности вероятности (например гаусс с неизвестными параметрами)? Рассмотрим идеальный случай.
Go to the top of the page
 
+Quote Post
NickNich
сообщение Jan 22 2007, 12:42
Сообщение #8


Местный
***

Группа: Свой
Сообщений: 375
Регистрация: 8-11-05
Пользователь №: 10 593



Цитата(emark @ Jan 22 2007, 12:33) *
Не понял.... что на что умножать (возводить) в моем случае?

Вы рассчитали доверительный интервал [5.299342e-01, 4.680735e-01] и точечную вероятность 0.499. Для того, чтобы определить в каких границах будет находиться вероятность выпадения 10^10 орлов подряд нужно возвести в степень 10^10 крайние значения доверительного интервала.

В случае с каналом связи (именно этот случай - Ваш) ничего умножать или возводить в степень не нужно, не поможет. У Вас вероятность отсутствия ошибки внутри выборки примерно 0,999999 (см. выше). Все что можно в такой ситуации сделать - увеличить длину реализации или размерность ансамбля реализаций.
Go to the top of the page
 
+Quote Post
emark
сообщение Jan 22 2007, 13:32
Сообщение #9


Участник
*

Группа: Участник
Сообщений: 34
Регистрация: 2-10-05
Пользователь №: 9 146



Цитата(NickNich @ Jan 22 2007, 14:42) *
Цитата(emark @ Jan 22 2007, 12:33) *

Не понял.... что на что умножать (возводить) в моем случае?

Вы рассчитали доверительный интервал [5.299342e-01, 4.680735e-01] и точечную вероятность 0.499. Для того, чтобы определить в каких границах будет находиться вероятность выпадения 10^10 орлов подряд нужно возвести в степень 10^10 крайние значения доверительного интервала.


Получим вероятность значительно превышающую единицу (у вас скорее всего описка).

Но если вернуться к слегка кривой монете и выпадении 100 орлов подряд я не вижу принципиальнных отличий от моего случая когда скажем рассматривается вероятность десятикратной подряд ошибки на моеей статистики (ведь возникновение ошибки - это тоже некое событие как и выпадение орла, только вероятность его 0.499, а 10е-5).

И потом, т.е. вы утверждаете , что на выборке 1000 при эксперименте с кривой монетой уже достаточно статистики чтобы делать выводы об очень редких событиях (100 орлов подряд) со столь малым доверительным интервалом?
Go to the top of the page
 
+Quote Post
NickNich
сообщение Jan 22 2007, 13:50
Сообщение #10


Местный
***

Группа: Свой
Сообщений: 375
Регистрация: 8-11-05
Пользователь №: 10 593



Цитата(emark @ Jan 22 2007, 13:32) *
Получим вероятность значительно превышающую единицу (у вас скорее всего описка).

Где именно?
(5.299342e-01)^(10^10)>>>1 или (4.680735e-01)^(10^10)>>>1? Какое из этих утверждений Вы имели ввиду?

Цитата(emark @ Jan 22 2007, 13:32) *
я не вижу принципиальнных отличий от моего случая


очень жаль, что Вы не видите. Выше я продемонстрировал принципиальные отличия в терминах вероятности появления события, вероятность которого определяется. Если это не понятно - тогда только учебник по основам теорвера...

Цитата(emark @ Jan 22 2007, 13:32) *
тоже некое событие как и выпадение орла, только вероятность его 0.499, а 10е-5

мы щас обсуждаем вероятности собятия порядка 10^-14, о которой Вы спрашивали в исходном сообщении

Цитата(emark @ Jan 22 2007, 13:32) *
И потом, т.е. вы утверждаете , что на выборке 1000 при эксперименте с кривой монетой уже достаточно статистики чтобы делать выводы об очень редких событиях (100 орлов подряд) со столь малым доверительным интервалом?

Не правильно.
Я утверждаю, что по выборке в 1000 отсчетов можно делать выводы об очень ЧАСТОМ событии (выпадении орла). После того, как выроятность выпадения орла в одном испытании получена (или получена интервальная оценка этой вероятности), то используя эту оценку можно расчитать вероятность выпадения произвольной комбинации орлов и решек. прадва, здесь нужно предполагать, что эти события (орел или решка) независимы. Но это тонкости, щас не существанные.

В качестве упражнения. Рассчитать вероятность выпадения знака "4" на шестигранной игральной кости по единственному испытанию, если в этом испытании выпал знак "1"....
Go to the top of the page
 
+Quote Post
emark
сообщение Jan 22 2007, 14:20
Сообщение #11


Участник
*

Группа: Участник
Сообщений: 34
Регистрация: 2-10-05
Пользователь №: 9 146



Цитата(NickNich @ Jan 22 2007, 15:50) *
Где именно?
(5.299342e-01)^(10^10)>>>1 или (4.680735e-01)^(10^10)>>>1? Какое из этих утверждений Вы имели ввиду?


Прошу прощения, стормозил smile.gif

Все-таки еще попробую донести свою мысль.

Имеем кривую монету. Событие "выпадение орла" - 10е-5, событие "выпадение решки" - (1- 10е-5)
Имеем выход декодера. Событие "ошибочно принятый бит" - 10е-5, событие "правильно принятый бит" -
(1- 10е-5).
Все очень похоже. В обоих случаях статистика, ну... 10е-8

Теперь.
Оцениваем вероятность события "выпадения 100 орлов подряд" - .....
Оцениваем вероятность события "100 ошибочных бит подряд" - .....
Все очень похоже.

В чем отличия?

Сообщение отредактировал emark - Jan 22 2007, 14:22
Go to the top of the page
 
+Quote Post
NickNich
сообщение Jan 22 2007, 14:52
Сообщение #12


Местный
***

Группа: Свой
Сообщений: 375
Регистрация: 8-11-05
Пользователь №: 10 593



Цитата(emark @ Jan 22 2007, 14:20) *
В чем отличия?

В такой постановке отличий никаких нет. Но изначально постановка задачи была другой. Монетка тут вообще случайно возникла, с подачи участника Tatiana. Вот в исходной постановке отличия есть и радикальные:

для монеты выроятность выпадения орла 0,5.
для канала выроятность ошибочно принять быт равна 10^-14.
Первое раджикальное различие - вероятности рассматриваемых событий отличаются на пятнадцать порядков.

Для монетки приводилась серия из 1000 испытаний. Скорее всего около половины из них состояли в выпадении орла. Для канала приводилось 10^8 испытаний. При заданной Вами вероятности скорее всего ни одно из них не содержит ошибочного бита. Т.е. для монетки выборка в 1000 испытаний - большая, дающая близкую к истинной оценку вероятности. Для канала c вероятностью ошибки 10^-14 выборка 10^8 маленькая и дает пенравильную оценку вероятности. Это второе радикальное отличие.

И собсно, исходный вопрос - можно ли проверить вероятность 10^-14 (специально не пользуюсь термином состятельно, т.к. здесь этот термин имеет специальный смысл) по выборке длиной 10^8. Ответ - при таких условиях проверить вероятность нельзя.

Как насчет задачки с игральной костью?
Go to the top of the page
 
+Quote Post
emark
сообщение Jan 22 2007, 15:14
Сообщение #13


Участник
*

Группа: Участник
Сообщений: 34
Регистрация: 2-10-05
Пользователь №: 9 146



Цитата(NickNich @ Jan 22 2007, 16:52) *
Цитата(emark @ Jan 22 2007, 14:20) *

В чем отличия?

В такой постановке отличий никаких нет. Но изначально постановка задачи была другой. Монетка тут вообще случайно возникла, с подачи участника Tatiana. Вот в исходной постановке отличия есть и радикальные:

для монеты выроятность выпадения орла 0,5.
для канала выроятность ошибочно принять быт равна 10^-14.
Первое раджикальное различие - вероятности рассматриваемых событий отличаются на пятнадцать порядков.

Для монетки приводилась серия из 1000 испытаний. Скорее всего около половины из них состояли в выпадении орла. Для канала приводилось 10^8 испытаний. При заданной Вами вероятности скорее всего ни одно из них не содержит ошибочного бита. Т.е. для монетки выборка в 1000 испытаний - большая, дающая близкую к истинной оценку вероятности. Для канала c вероятностью ошибки 10^-14 выборка 10^8 маленькая и дает пенравильную оценку вероятности. Это второе радикальное отличие.

И собсно, исходный вопрос - можно ли проверить вероятность 10^-14 (специально не пользуюсь термином состятельно, т.к. здесь этот термин имеет специальный смысл) по выборке длиной 10^8. Ответ - при таких условиях проверить вероятность нельзя.

Как насчет задачки с игральной костью?


В случае кости со смещенным центром тяжести - никак (может быть слишком сильное утверждение smile.gif. Теперь я понял в чем корень непонимания. Вы рассматриваете случайные события с четко известной плотностью распределения вероятности. Я же события (для упрощения) с известной формой (например гауссовой), но неизвестными переметрами. Обратите внимание, я и про монету рассуждал всегда кривую (форма распределения известна (допустим), а параметр "кривизны" - нет). Мне интересен именно этот случай. Как же с ним-то? Т.е. имеем источник гауссовых помех, имеем вероятность битовой ошибки - 1е-5, имеем статистику 10е+8. Нужно оценить вероятность 5 ошибок подряд и ее доверительный интервал.
Go to the top of the page
 
+Quote Post
NickNich
сообщение Jan 22 2007, 15:34
Сообщение #14


Местный
***

Группа: Свой
Сообщений: 375
Регистрация: 8-11-05
Пользователь №: 10 593



Цитата(emark @ Jan 22 2007, 15:14) *
Теперь я понял в чем корень непонимания. Вы рассматриваете случайные события с четко известной плотностью распределения вероятности.

Неправильно. Я рассматрвиаю случайные события, вероятность которых вообще неизвестна, и эту вероятность нужно определить по множеству испытаний. Для того, чтобы оценить размер этого "множества испытаний" я использую априорное знание о структуре исследуемого процесса.

Цитата(emark @ Jan 22 2007, 15:14) *
Я же события (для упрощения) с известной формой (например гауссовой), но неизвестными переметрами.

Это - к учебнику по основам теорвера. Гауссиана - это плотность вероятности случайного величины, значение которой лежит в пределах от -inf до +inf. У вас - точечное событие, которое либо произошло либо нет. Применительно к каналу для характеристики появления ошибок таких ошибок используется специальное понятие - "поток событий". Там свои вероятности и свои законы распределения. Поищите например "пуассоновский поток".

Цитата(emark @ Jan 22 2007, 15:14) *
Т.е. имеем источник гауссовых помех, имеем вероятность битовой ошибки - 1е-5, имеем статистику 10е+8. Нужно оценить вероятность 5 ошибок подряд и ее доверительный интервал.

Вы уже задали вероятность появления битовой ошибки, 1е-5. Вам не нужно экспериментально определять значение этой вероятности - его вы уже задали. (Доверительный интервал тут не при делах - см. ниже. ) В этом случае про плотность распределения шума можно уже не говорить. свойства этой плотности уже были использованы для получения вероятности битовой ошибки p=1е-5. Т.е. вероятность одного события задана точно. Вероятность обранужения M событий подряд внутри выборки размером N равна

P=(N-M+1)*p^M*(1-p)^(N-M).


Другой вопрос - как рассчитать вероятность битовой ошибки по реализации длиной 10^8. Вот здесь и выплывают доверительные интервалы. Доверительная оценка - это способ определения некоторого неизвестного параметра (не важно чего - среднего значения, дисперсии, вероятности и т.д.) по набору ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ.
Go to the top of the page
 
+Quote Post
emark
сообщение Jan 22 2007, 20:40
Сообщение #15


Участник
*

Группа: Участник
Сообщений: 34
Регистрация: 2-10-05
Пользователь №: 9 146



Цитата(NickNich @ Jan 22 2007, 17:34) *
Неправильно. Я рассматрвиаю случайные события, вероятность которых вообще неизвестна, и эту вероятность нужно определить по множеству испытаний. Для того, чтобы оценить размер этого "множества испытаний" я использую априорное знание о структуре исследуемого процесса.


Стоп. Предположим, что ваши априорные знания ограничены только знаниями, что может выпасть орел или решка. В результате выполнения 10е+8 экспериментов выяснилось, что вероятность выпадения орла равна 10е-5 (посчитано). Посчитан доверительный интервал. Вопрос, с какой точностью (имея на руках статистику 10е+8) можно предсказать выпадение 100 орлов подряд?
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- emark   Стат. обработка экспериментальных данных   Jan 18 2007, 19:29
||- - Alex255   2 emark Относительная погрешность оценки вероятнос...   Jan 22 2007, 16:36
|||- - NickNich   Цитата(Alex255 @ Jan 22 2007, 16:36) Така...   Jan 22 2007, 16:54
|||- - Alex255   Цитата(NickNich @ Jan 22 2007, 16:54) Цит...   Jan 22 2007, 20:17
||- - emark   Цитата(NickNich @ Jan 22 2007, 17:34) Цит...   Jan 22 2007, 20:22
|||- - NickNich   Цитата(emark @ Jan 22 2007, 20:22) Я ее н...   Jan 23 2007, 14:57
|||- - emark   Цитата(NickNich @ Jan 23 2007, 16:57) Цит...   Jan 23 2007, 16:35
|- - emark   Цитата(NickNich @ Jan 19 2007, 12:43) Воо...   Jan 20 2007, 11:12
|- - NickNich   Цитата(emark @ Jan 20 2007, 11:12) Дело в...   Jan 22 2007, 09:49
- - Kail   Когда-то очень крутой препод на Стохастической опт...   Mar 18 2007, 17:59


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 18th June 2025 - 20:39
Рейтинг@Mail.ru


Страница сгенерированна за 0.01581 секунд с 7
ELECTRONIX ©2004-2016