"Соотношение" в качестве переменной регрессионного анализа

Все остальное, мало относящееся к ГИС.
Ответить
Odd-Bird
Интересующийся
Сообщения: 29
Зарегистрирован: 29 окт 2014, 17:48
Репутация: 0

"Соотношение" в качестве переменной регрессионного анализа

Сообщение Odd-Bird » 16 сен 2015, 20:59

Доброго времени суток! Хочу задать пару вопросов о множественной регрессии. Я изучаю связь между сезонным предпочтением птицами различных биотопов и обилием корма в них. Показатель предпочтения биотопа А вычисляется как:

PA = DA / Dmean,

где DA - плотность населения птиц в данном биотопе, Dmean - средняя плотность населения птиц в регионе.

Я предполагаю, что предпочтение конкретного биотопа зависит от его кормовой благоприятности относительно других биотопов (обозначенных 1-i):

PA = b1*FA/F1 + ... + bi*FA/Fi,

где Fi - обилие кормов в биотопе i, bi - коэффициенты (не меняющиеся в течение сезона).

ВОПРОСЫ :?:

1. Можно ли использовать относительные показатели (PA, FA/Fi) в качестве зависимых и независимых переменных множественной линейной регрессии? Следует ли применить логарифмическую трансформацию?

2. Я предполагаю, что связь между обилием кормов и предпочтением биотопа всегда неотрицательна, и данные это подтверждают. Тем не менее, при вычислении регрессии (по уравнению, представленному выше) некоторые из бета-коэффициентов отрицательные. Как я понимаю, биологического смысла такой результат не имеет. Можно ли как-то задать ограничения на допустимые значения бета-коэффициентов?

Спасибо! :)
Последний раз редактировалось Odd-Bird 17 сен 2015, 10:24, всего редактировалось 1 раз.
>>> Odd-Bird.do.am — Библиография научных работ о птицах России <<<

gamm
Гуру
Сообщения: 4064
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1061
Ваше звание: программист
Откуда: Казань

Re: "Соотношение" в качестве переменной регрессионного анали

Сообщение gamm » 17 сен 2015, 06:08

Odd-Bird писал(а):Я изучаю связь между сезонным предпочтением птицами различных биотопов и обилием корма в них. Показатель предпочтения биотопа А вычисляется как:

PA = DA / Dmean,

где DA - плотность населения птиц в данном биотопе, Dmean - средняя плотность населения птиц в регионе.
с плотностями работать нехорошо, разве только у вас численности гигантские и площади одинаковые. Для работы с счетчиками придуманы распределения Пуассона и Negative Binomial
Я предполагаю, что предпочтение конкретного биотопа зависит от его кормовой благоприятности относительно других биотопов (обозначенных 1-i):

PA = k1*FA/Fi + ... + ki*FA/Fi,

где Fi - обилие кормов в биотопе i, ki - коэффициенты (не меняющиеся в течение сезона).
что-то странное у вас написано, проверьте - видимо, в первом слагаемом FA/F1 должно быть, а ki потом, похоже, бетами названы. И непонятно, почему коэффициенты должны быть разными, а не одним (вынесенным за сумму отношений) - откуда асимметрия?
ВОПРОСЫ :?:

1. Можно ли использовать относительные показатели (PA, FA/Fi) в качестве зависимых и независимых переменных множественной линейной регрессии? Следует ли применить логарифмическую трансформацию?
насчет зависимой переменной - нужно смотреть на данные, можно ли использовать нормальную (Гауссовскую) аппроксимацию. И непонятно, нужно ли моделировать численность, или вероятность выбора данного биотопа (использовать биномиальную модель).

Насчет независимых - непонятно, может и разность логарифмов лучше использовать. Можно вообще рассматривать сигмоид от отношения обилия кормов как вероятность выбора данного биотопа, и брать произведение таких вероятностей, а параметры сигмоида рассматривать как параметры модели вместо k_i. Если эти параметры рассматривать не как константы, не зависящие от биотопов, а как случайные величины (т.е. делать модель со случайными эффектами), то можно компенсировать априорное различие биотопов по привлекательности. А если есть данные о пространственном положении, и биотопы расположены по соседству, можно и пространственную корреляцию компенсировать. В общем, можно несколько моделек соорудить, и статейку написать :-)
2. Я предполагаю, что связь между обилием кормов и предпочтением биотопа всегда неотрицательна, и данные это подтверждают. Тем не менее, при вычислении регрессии (по уравнению, представленному выше) некоторые из бета-коэффициентов отрицательные. Как я понимаю, биологического смысла такой результат не имеет. Можно ли как-то задать ограничения на допустимые значения бета-коэффициентов?
конечно можно. Только не для обычной регрессии, которая сидит на кнопке в обычной программе. Нужно нормальную модель писать, и использовать Байесовские методы, там любые ограничения выписываются явно. При этом не факт, что модель должна иметь указанный вид - нужно какое-то обоснование, почему сумма, почему коэффициенты разные, и т.д..

Odd-Bird
Интересующийся
Сообщения: 29
Зарегистрирован: 29 окт 2014, 17:48
Репутация: 0

Re: "Соотношение" в качестве переменной регрессионного анали

Сообщение Odd-Bird » 17 сен 2015, 10:48

Спасибо за ответ!
gamm писал(а):с плотностями работать нехорошо, разве только у вас численности гигантские и площади одинаковые. Для работы с счетчиками придуманы распределения Пуассона и Negative Binomial
А что делать, приходится... :? Численности достаточно велики (в основном с массовыми видами имеем дело), их оценка достаточно надежна (усреднена за несколько лет), а площади сопоставимы (5 основных типов местообитаний). Так или иначе, мерилом предпочтения служит именно плотность, а не численность, которая зависит также от представленности биотопа в ландшафте. Впрочем, в описанном примере местообитания рассматриваются по отдельности, и в этом случае в качестве показателя сезонного предпочтения можно использовать и долю численности птиц, использующих данное местообитание.
что-то странное у вас написано, проверьте - видимо, в первом слагаемом FA/F1 должно быть, а ki потом, похоже, бетами названы.
Да, прошу прощения, опечатки.
И непонятно, почему коэффициенты должны быть разными, а не одним (вынесенным за сумму отношений) - откуда асимметрия?
Дело в том, что изменения обилия кормов в разных биотопах могут иметь разную значимость для птиц. Скажем, десятикратное увеличение обилия корма на лугу практически никак не скажется на предпочтении ельника, поскольку луг малопригоден для обитания лесных птиц. А двукратное увеличение обилия корма в ивняке может привести к тому, что многие птицы покинут ельник и переместятся в ивняк.

Похоже, это именно то, что вы ниже назвали "априорными предпочтениями". Проблема еще в том, что в течение сезона они, скорее всего, тоже не совсем постоянны.
Насчет независимых - непонятно, может и разность логарифмов лучше использовать. Можно вообще рассматривать сигмоид от отношения обилия кормов как вероятность выбора данного биотопа, и брать произведение таких вероятностей, а параметры сигмоида рассматривать как параметры модели вместо k_i. Если эти параметры рассматривать не как константы, не зависящие от биотопов, а как случайные величины (т.е. делать модель со случайными эффектами), то можно компенсировать априорное различие биотопов по привлекательности. А если есть данные о пространственном положении, и биотопы расположены по соседству, можно и пространственную корреляцию компенсировать. В общем, можно несколько моделек соорудить, и статейку написать :-)
Звучит заманчиво :) Сигмоид - это в смысле подгонять логистическую кривую вместо прямой? Это я примерно представляю, а вот случайные эффекты, пространственная корреляция и проч. - пока нет, попробую поискать литературу...
>>> Odd-Bird.do.am — Библиография научных работ о птицах России <<<

gamm
Гуру
Сообщения: 4064
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1061
Ваше звание: программист
Откуда: Казань

Re: "Соотношение" в качестве переменной регрессионного анали

Сообщение gamm » 17 сен 2015, 12:06

Odd-Bird писал(а): Так или иначе, мерилом предпочтения служит именно плотность, а не численность
там тоже плотность, но по другому записанная - там логарифмическая функция связи, и offset. Для счетчиков проблема в том, что дисперсия пропорциональна среднему, и это нужно учитывать. А при вычислении плотности дисперсия искажается, если площади разные.
которая зависит также от представленности биотопа в ландшафте.
тоже offset. При этом модель должна строиться по описаниям, не объединяя их по экотопам/биотопам. И если описания за разные годы - тоже учесть в модели.
Дело в том, что изменения обилия кормов в разных биотопах могут иметь разную значимость для птиц. Скажем, десятикратное увеличение обилия корма на лугу практически никак не скажется на предпочтении ельника, поскольку луг малопригоден для обитания лесных птиц.
ясно, у вас на самом деле индексируются виды корма, а не местообитания. И вам нужно как-то учесть "коэффициент замещения" одного вида корма другим
Проблема еще в том, что в течение сезона они, скорее всего, тоже не совсем постоянны.
если измерений несколько, то тоже в модель, как случайные эффекты. Если бы была схема сбора данных, то было бы понятнее (схема сбора исходных данных, до всяких пересчетов и агрегаций).
Звучит заманчиво :) Сигмоид - это в смысле подгонять логистическую кривую вместо прямой?
нет, произведение логистических регрессий - предполагаем, что предпочтение есть вероятностный процесс, попарные предпочтения независимы, и получаем вероятность выбора как произведение попарных вероятностей.

В общем, если будет описание схемы сбора исходных данных, можно попробовать написать модель.

Odd-Bird
Интересующийся
Сообщения: 29
Зарегистрирован: 29 окт 2014, 17:48
Репутация: 0

Re: "Соотношение" в качестве переменной регрессионного анали

Сообщение Odd-Bird » 17 сен 2015, 16:18

Отправил личное сообщение.
у вас на самом деле индексируются виды корма, а не местообитания. И вам нужно как-то учесть "коэффициент замещения" одного вида корма другим
Думаю, дело не столько в видах корма (в принципе, сам корм может быть примерно одним и тем же в разных биотопах), сколько в условиях его сбора. Скажем, виды, приспособленные для сбора насекомых на голой почве, не любят кормиться в густой траве, но если там вдруг появляется очень много корма - то это может скомпенсировать неудобство его сбора. Кроме того, значение имеют и "некормовые" свойства местообитаний, например защищенность от хищников.
При этом модель должна строиться по описаниям, не объединяя их по экотопам/биотопам. И если описания за разные годы - тоже учесть в модели.
Исходные данные представлены в виде показателей обилия для отдельных 250-м отрезков (разумеется, у этих показателей очень большая стандартная ошибка).
>>> Odd-Bird.do.am — Библиография научных работ о птицах России <<<

Ответить

Вернуться в «Все остальное»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость