Статистическая ошибка плотности точек в нескольких полигонах

Вопросы по статистическому пакету R. Не обязательно гео.
Ответить
Аватара пользователя
Игорь
Интересующийся
Сообщения: 33
Зарегистрирован: 19 ноя 2008, 12:25
Репутация: 6

Статистическая ошибка плотности точек в нескольких полигонах

Сообщение Игорь » 22 окт 2010, 02:59

С математикой совсем плохо у меня. Задача ввести в форму формулу, которая бы рассчитывала статистическую ошибку плотности точек внутри нескольких полигонов разной площади. Т.е. имеется допустим 10 полигонов площадью от 10 до 100 кв.км. в каждом от 2 до 10 точек. Средняя плотность (Pср) считается как средневзвешенная: количество точек (n) делённое на сумму площадей полигонов (Sо). Какая будет формула рассчёта статистической ошибки средней плотности?
Я предполагаю такой вот вариант, но не уверен: e= 1/So* корень из (1/Pср* cумма ((((Pср-Рp)*Sp)в квадрате)/So-Sp))
где Рр - плотность точек в отдельно взятом полигоне, Sp - площадь отдельно взятого полигона.
Помогите пожалуйста кто знает.

gamm
Гуру
Сообщения: 4056
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1054
Ваше звание: программист
Откуда: Казань

Re: Статистическая ошибка плотности точек в нескольких полигонах

Сообщение gamm » 22 окт 2010, 14:14

Игорь писал(а):С математикой совсем плохо у меня. Задача ввести в форму формулу, которая бы рассчитывала статистическую ошибку плотности точек внутри нескольких полигонов разной площади. Т.е. имеется допустим 10 полигонов площадью от 10 до 100 кв.км. в каждом от 2 до 10 точек. Средняя плотность (Pср) считается как средневзвешенная: количество точек (n) делённое на сумму площадей полигонов (Sо). Какая будет формула рассчёта статистической ошибки средней плотности?
Я предполагаю такой вот вариант, но не уверен: e= 1/So* корень из (1/Pср* cумма ((((Pср-Рp)*Sp)в квадрате)/So-Sp))
где Рр - плотность точек в отдельно взятом полигоне, Sp - площадь отдельно взятого полигона.
Помогите пожалуйста кто знает.
видимо, нужна ошибка средней плотности по всем полигонам?

1) Раз речь идет о точках, они обычно рассматриваются как результат реализации Пуассоновского процесса, плотность которого lambda есть константа. Тогда для i-го полигона матожидание числа точек есть mu_i=lambda*S_i, дисперсия равна матожиданию. Ввиду отсуствия матожидания оцениваем дисперсию n_i как само число точек n_i.

2) Оценка плотности есть n_i/S_i, дисперсия оценки есть - в соотвествии с (1) есть n_i/S_i^2

3) Находим наилучшую оценку плотности как средневзвешенную с весом, обратным СКО (ср.кв.отклонению)
веса w_i=(1 / sqrt(n_i/S_i^2)) / SUM_k(1 / sqrt(n_k/S_k^2))
lambda_bar=SUM_i((n_i/S_i) * w_i)

4) Находим дисперсию оценки
var(lambda_bar)=SUM_i((n_i/S_i)*w_i^2)

как-то так ... только боюсь "ввести в форму" не получится, возможностей в форме не хватит - придется считать руками. Можно просто свалить все полигоны в одну кучу, тогда оценка плотности SUM(n_i)/SUM(S_i), оценка дисперсии SUM(n_i)/(SUM(S_i))^2, это в форму влезет. Результат в предположении что lambda константа примерно такой же.

контрольный пример на R прилагается.

p.lambda<-0.5
p.n<-10
p.S<-runif(p.n,1,100)

p.num<-pmax(1,rpois(p.n,p.lambda*p.S))

p.mean <- p.num/p.S
p.var <- p.num/p.S^2
p.w <- 1/sqrt(p.var)/sum(1/sqrt(p.var))
p.lambda_bar <- sum(p.mean*p.w)
p.lambda_var <- sum(p.var *p.w^2)

# небольшой контроль
p.x<-rep(NA,10000)
p.v<-rep(NA,10000)
for(i in 1:10000) {
p.num<-pmax(1,rpois(p.n,p.lambda*p.S))

p.mean <- p.num/p.S
p.var <- p.num/p.S^2
p.w <- 1/sqrt(p.var)/sum(1/sqrt(p.var))
p.x <- sum(p.mean*p.w)
p.v <- sum(p.var *p.w^2)
}
var(p.x)
# [1] 0.001463503
summary(p.v)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 0.0008636 0.0012690 0.0013450 0.0013450 0.0014200 0.0017640

Аватара пользователя
Игорь
Интересующийся
Сообщения: 33
Зарегистрирован: 19 ноя 2008, 12:25
Репутация: 6

Re: Статистическая ошибка плотности точек в нескольких полигонах

Сообщение Игорь » 22 окт 2010, 15:06

Спасибо большое! Попытаюсь разобраться

Ответить

Вернуться в «R»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 4 гостя