|
Усреднение двумерных выборок |
|
|
|
Nov 20 2015, 11:37
|
Местный
  
Группа: Свой
Сообщений: 237
Регистрация: 14-08-07
Из: Москва
Пользователь №: 29 791

|
Цитата(thermit @ Nov 20 2015, 14:19)  ...максимумом плотности (гистограммы). Ну и что это за величина, по-вашему? А если ваша гистограмма имеет плоскую волнистую вершинку? Всё, хана, лапки вверх? Ничего не считается? Матожидание имеет физический смысл. Это "центр тяжести". Ваш " максимум плотности" - это что?
|
|
|
|
|
Nov 20 2015, 11:44
|
ʕʘ̅͜ʘ̅ʔ
    
Группа: Свой
Сообщений: 1 008
Регистрация: 3-05-05
Пользователь №: 4 691

|
Целая куча "средних", и каждое с бездной физического смысла. Считайте на здоровье! https://en.wikipedia.org/wiki/Average#Summary_of_typesНапример, если вы оцениваете среднюю зарплату, то ваше любимое мат. ожидание никакого смысла не имеет. Может оказаться, что не существует человека, получающего даже близко к мат. ожиданию. Медиана или мода (максимум плотности, о котором вы спрашивали) - куда более ценные показатели в этом случае. Цитата(r_dot @ Nov 20 2015, 12:37)  Ну и что это за величина, по-вашему? А если ваша гистограмма имеет плоскую волнистую вершинку? Всё, хана, лапки вверх? Ничего не считается?
Матожидание имеет физический смысл. Это "центр тяжести". Ваш "максимум плотности" - это что?
|
|
|
|
|
Nov 20 2015, 12:05
|
Местный
  
Группа: Свой
Сообщений: 237
Регистрация: 14-08-07
Из: Москва
Пользователь №: 29 791

|
Цитата(Fat Robot @ Nov 20 2015, 14:44)  Целая куча "средних", и каждое с бездной физического смысла.... Ну так я-то предложил ТС-у наиболее подходящее, на мой взгляд, решение для его задачи. А что вы предлагаете? Может, всё-таки, ответите, что за " максимум плотности (диаграммы)" такой? В той " целой куча "средних", куда вы меня носом тычете - что-то такого нет...
|
|
|
|
|
Nov 20 2015, 12:10
|
ʕʘ̅͜ʘ̅ʔ
    
Группа: Свой
Сообщений: 1 008
Регистрация: 3-05-05
Пользователь №: 4 691

|
Ну как же нету? https://en.wikipedia.org/wiki/Mode_(statistics)Гнев и гордыня застилают вам обзор. И да, решение вы предложили слабое. Оно не учитывает наличие outlier'ов, о которых говорилось в исходном сообщении. Посмотрите, в этой ветке много решений. в том числе и мое. Успехов. Цитата(r_dot @ Nov 20 2015, 13:05)  Ну так я-то предложил ТС-у наиболее подходящее, на мой взгляд, решение для его задачи. А что вы предлагаете? Может, всё-таки, ответите, что за "максимум плотности (диаграммы)" такой? В той "целой куча "средних", куда вы меня носом тычете - что-то такого нет...
|
|
|
|
|
Nov 20 2015, 12:12
|
Местный
  
Группа: Свой
Сообщений: 237
Регистрация: 14-08-07
Из: Москва
Пользователь №: 29 791

|
Цитата(thermit @ Nov 20 2015, 15:01)  Мода Ткнули вы неудачно. В задаче ТС-а скорее всего получится мультимодальность - будет несколько разных, но одинаково часто встречающихся значений. Не подходит Мода.
|
|
|
|
|
Nov 20 2015, 12:22
|
Гуру
     
Группа: Свой
Сообщений: 3 106
Регистрация: 18-04-05
Пользователь №: 4 261

|
Цитата(r_dot @ Nov 20 2015, 16:12)  Ткнули вы неудачно. Так ТС уже сказал, что среднее арифметическое его НЕ устраивает, а значит, НЕ устраивает его и математическое ожидание: Цитата(minibrain @ Nov 19 2015, 19:08)  В данный момент находится среднее арифметическое по обеим координатам, но выбросы порождают большое смещение от точки, на которую указывает большинство измерений. Оттого и предлагают ему другие решения..
|
|
|
|
|
Nov 20 2015, 12:25
|
Знающий
   
Группа: Участник
Сообщений: 781
Регистрация: 3-08-09
Пользователь №: 51 730

|
Цитата(r_dot @ Nov 20 2015, 15:12)  Ткнули вы неудачно. В задаче ТС-а скорее всего получится мультимодальность - будет несколько разных, но одинаково часто встречающихся значений. Не подходит Мода.  Не спорю. Однако тээсу это решение больше понравилось, чем ваше удачное. Успехов.
|
|
|
|
|
Nov 21 2015, 09:05
|
Участник

Группа: Участник
Сообщений: 46
Регистрация: 29-12-14
Из: Санкт-Петербург
Пользователь №: 84 344

|
Цитата(_pv @ Nov 19 2015, 22:52)  это некое жульничество, когда на картинке линия их нескольких точек, а на самом деле там не по одной точке, а по десять штук друг на дружке и в результате этих левых точек вообще больше чем тех положение которых посчитать надо. соответственно там все эти левые точки получаются внутри 3х сигм. тем не менее если выкинуть точки которые лежат за пределом эллипса из одной сигмы, можно даже пару раз подряд, потом посчитать среднее от оставшихся, и дальше среднеквадратичное отклонение считать уже относительно этого нового среднего, и после этого если выкинуть точки за пределами одной новой сигмы, на данной конкретной картинке получается довольно неплохо, координаты среднего {-5.57342, -7.20079}. ну и сколько именно сигм оставлять надо поподбирать будет, чтобы для других произвольных данных тоже нормально работало.
при этом наименьшие квадраты (последняя страница) дают почти то же самое {x0 -> -5.1126, y0 -> -7.91728}.
по поводу С/С++ библиотек можно еще alglib посмотреть, хотя только для фита наименьшими квадратами из своего приложения можно вообще gnuplotом обойтись. Посмотрел ваш PDFник и...ничего не понял. Это тоже матлаб? Ни одного знакомого идентификатора
|
|
|
|
|
Nov 21 2015, 10:34
|

Профессионал
    
Группа: Участник
Сообщений: 1 072
Регистрация: 11-12-12
Пользователь №: 74 815

|
Видимо, ТСу подойдет итерационный метод, когда находится матожидание, выкидывается самый удаленный элемент, по оставшимся находится матожидание... и т. д. пока не останется статистически значимое число элементов, матожидание от которых и будет результатом. В качестве старта для статистически значимого числа эментов можно взять корень из исходного числа элементов или задать остаточное ср. кв. отклонение для оставшихся элементов и ждать схождения, но при сильном разбросе второй вариант может не давать решения. Собственно так работает обнаружитель в рлс, только там есть еще третья координата номера выборки и четвертый параметр вероятности отклика. И так же навигационные приемники находят вероятные координаты, когда спутников много.
Сообщение отредактировал Corner - Nov 21 2015, 10:41
|
|
|
|
|
Nov 21 2015, 11:03
|
Гуру
     
Группа: Свой
Сообщений: 2 563
Регистрация: 8-04-05
Из: Nsk
Пользователь №: 3 954

|
Цитата(minibrain @ Nov 21 2015, 16:05)  Посмотрел ваш PDFник и...ничего не понял. Это тоже матлаб? Ни одного знакомого идентификатора This is SPARTAAAA Mathematica. Синтаксис да, с непривычки очень своеобразный местами. Функция CleanData просто отбрасывает точки которые оказались за эллипсом с радиусами std_, и положением avg_. Соответственно вызвав её пару раз по исходным данным с avg и std соответственно равным среднему и среднеквадратичному часть наиболее удалённых точек будут отброшены, после этого уже можно более менее нормально по оставшимся данным посчитать среднее, и затем посчитать среднеквадратичное отклонение относительно этого среднего, чтобы отбросить точки уже относительно более менее нормальной оценки среднего, по сравнению с исходной. ну и как уже говорил тупо фит наименьшими квадратами двумерной функции Гаусса, отбрасывает не похожие на этот Гаусс точки тоже очень неплохо.
|
|
|
|
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|