Страница 1 из 1

Равномерная выборка

Добавлено: 26 май 2013, 12:37
Yulia-Kl
Мне нужно выбрать какое-то кол-во точек с двумерными координатами из моих 300, скажем 100. Точки расположены кучно, гораздо более кучно, чем нужно, и неравномерно. Для того, чтобы в дальнейшем дать MaxEnt-y, мне бы хорошо их прорядить...

Наводка:
1) Взять не ближе чем через ...цать метров (могу сама).
2) Взять случайные несуществующие точки через равные промежутки, лежащие между существующими (тоже могу).

Может быть есть какие-то...ммм... более статистически обоснованные методы?

Re: Равномерная выборка

Добавлено: 26 май 2013, 14:39
jerry-maori
Декластеризация (cell-declustering) вам поможет... Обоснованно -- аш зубы сводит
http://webhelp.esri.com/arcgisdesktop/9 ... 20sampling
http://www.academia.edu/335226/Optimizi ... of_Methods

Re: Равномерная выборка

Добавлено: 31 май 2013, 09:21
Yulia-Kl
Это кригинг. Спасибо, конечно. Но мне не нужна поверхность, откуда я потом возьму точки. Мне нужно прорядить существующие и использовать существующие точки встреч животных. Может быть вам известны подобные статьи?

Re: Равномерная выборка

Добавлено: 31 май 2013, 18:10
gamm
[quote="Yulia-Kl"]тут и без статей можно ...
0) берем R (без этого нынче никуда)
1) строим функцию плотности точек, например непараметрические оценки плотности (kde {ks}, npEM {mixtools}), метод окна Парзена (density {stats}), в примерах показано, как выбиратьразмер окна (bandwidth).
2) вычисляем 1/плотность в наших точках, нормируем сумму к 1, получаем вероятности выборки, кладем их в our.prob
3) делаем sample.int(1:300, size = 100, prob = our.prob), получаем номера точек.

как-то так ...

Re: Равномерная выборка

Добавлено: 02 июн 2013, 09:47
Yulia-Kl
Спасибо! Я самостоятельно, в поисках, то что называется stumbled upon kde - kernel density estimation (программа Animal Space Use). Размер зерна в ней рассчитывается через likelihood cross-validation (из этой <a href="http://www.cnr.uidaho.edu/population_ec ... >статьи</a>), в этой же программе каждому kernel приписывается вероятность встречи через плотность точек в этом зерне в сумме равная единице (нормализация).

А вот последний шаг:
3) делаем sample.int(1:300, size = 100, prob = our.prob), получаем номера точек - это типа функции рэндомной выбрки?

Если можно, gamm, я хотела спросить у Вас. Если порассуждать. Для анализа в Максенте имеет ли смысл такой отбор... ммм... из функции распределения, а не из самого распределения. То есть вероятность встречи вида в n-точке уже не 1, а ниже. Дополнительные зависимости и вероятности.

Может быть есть способ отобрать из имеющихся точек? Проблема с ними в том, что они были отобраны кластерами (типа, модельных площадок), что между ними - неизвестно.

Re: Равномерная выборка

Добавлено: 03 июн 2013, 12:42
gamm
Yulia-Kl писал(а):3) делаем sample.int(1:300, size = 100, prob = our.prob), получаем номера точек - это типа функции рэндомной выбрки?
это выборка в соотвествии с неравными вероятностями, см. документацию
Для анализа в Максенте имеет ли смысл такой отбор... ммм... из функции распределения, а не из самого распределения. То есть вероятность встречи вида в n-точке уже не 1, а ниже. Дополнительные зависимости и вероятности.
вероятность в точке не единица, не путайте вероятность события и реализацию. Что касается Максента, то такой способ годится только в том случае, когда обследование территории проводилось равномерно, т.е. sampling efforts - длина маршрутов, и т.д., одинаковая. Иначе вместо плотности точек нужно строить плотность sampling efforts, и уже из нее получать вероятность.
Может быть есть способ отобрать из имеющихся точек?
то, что я написал, и есть отбор из имеющихся точек. Но учитывая, что точек обычно не сильно много, для выравнивания выборки я бы скорее размножил те, которых мало, чем выбросил те, которых много. В любом случае полученная из Максента функция распределения (если ее применять для всей территории) потребует коррекции в соответствии с вероятностью условий, представленных на площадках. Грубо говоря, Максент выдаст вам то ли детектор площадок, то ли детектор видов на площадках, и их разделение потребует усилий - полученный результат предполагает, что территория обследовылась равномерно (т.е. sampling efforts были одинаковые в каждой точке, в этом случае априорная вероятность сокращается).

Re: Равномерная выборка

Добавлено: 08 июн 2013, 10:28
Yulia-Kl
Все-таки я некорректно выразилась. Это не площадки, а маршруты учетов. Но территория, на которою ареал будет моделироваться, настолько больше той, что была пройдена маршрутами, что в результате точки лежат кластерами и очень кучно (иллюстрация в файле). Вот думаю как прорядить. Почитала Ваше последнее сообщение - ничего не поняла. Не подскажите ли чуть более подробно, что тут можно сделать?

Re: Равномерная выборка

Добавлено: 08 июн 2013, 13:25
gamm
Yulia-Kl писал(а):Не подскажите ли чуть более подробно, что тут можно сделать?
зная, как устроен Maxent, могу сказать, что нужно просто ограничить территорию некоторым буфером вдоль маршрутов учета (не только там, где нашли, но весь маршрут), все остальное забить N/A. Размер буфера выбирается в соответствии с методикой учета (на каком расстоянии от оси маршрута вы в состоянии были обнаружить вид).

Построить нужно две модели: одну для распределения птичек внутри буфера, вторую для отделения неизведанного: считаем все ячейки буфера местами находок, и строим модель относительно всей территории. Вторая модель нужна для того, чтобы на тех участках территории, которые сильно отличны по свойствам от буфера, выдавать N/A.

как-то так ...

Re: Равномерная выборка

Добавлено: 08 июн 2013, 15:26
Yulia-Kl
да, спасибо. надо попробовать.

про самплинг эффортс - в максенте есть возможность использовать bias grid - во время анализа он ограничиывает выборку pseudo-absences. задумка такая, что если выборка присутствий и выборка отсуствий предвзяты, то при "наложении" предвзятость взаимоисключится, произойдет "коррекция в соответствии с вероятностью условий, представленных на площадках"...