Доброго времени суток! Хочу задать пару вопросов о множественной регрессии. Я изучаю связь между сезонным предпочтением птицами различных биотопов и обилием корма в них. Показатель предпочтения биотопа А вычисляется как:
PA = DA / Dmean,
где DA - плотность населения птиц в данном биотопе, Dmean - средняя плотность населения птиц в регионе.
Я предполагаю, что предпочтение конкретного биотопа зависит от его кормовой благоприятности относительно других биотопов (обозначенных 1-i):
PA = b1*FA/F1 + ... + bi*FA/Fi,
где Fi - обилие кормов в биотопе i, bi - коэффициенты (не меняющиеся в течение сезона).
ВОПРОСЫ
1. Можно ли использовать относительные показатели (PA, FA/Fi) в качестве зависимых и независимых переменных множественной линейной регрессии? Следует ли применить логарифмическую трансформацию?
2. Я предполагаю, что связь между обилием кормов и предпочтением биотопа всегда неотрицательна, и данные это подтверждают. Тем не менее, при вычислении регрессии (по уравнению, представленному выше) некоторые из бета-коэффициентов отрицательные. Как я понимаю, биологического смысла такой результат не имеет. Можно ли как-то задать ограничения на допустимые значения бета-коэффициентов?
Спасибо!
"Соотношение" в качестве переменной регрессионного анализа
-
- Интересующийся
- Сообщения: 29
- Зарегистрирован: 29 окт 2014, 17:48
- Репутация: 0
"Соотношение" в качестве переменной регрессионного анализа
Последний раз редактировалось Odd-Bird 17 сен 2015, 10:24, всего редактировалось 1 раз.
>>> Odd-Bird.do.am — Библиография научных работ о птицах России <<<
-
- Гуру
- Сообщения: 4069
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1064
- Ваше звание: программист
- Откуда: Казань
Re: "Соотношение" в качестве переменной регрессионного анали
с плотностями работать нехорошо, разве только у вас численности гигантские и площади одинаковые. Для работы с счетчиками придуманы распределения Пуассона и Negative BinomialOdd-Bird писал(а):Я изучаю связь между сезонным предпочтением птицами различных биотопов и обилием корма в них. Показатель предпочтения биотопа А вычисляется как:
PA = DA / Dmean,
где DA - плотность населения птиц в данном биотопе, Dmean - средняя плотность населения птиц в регионе.
что-то странное у вас написано, проверьте - видимо, в первом слагаемом FA/F1 должно быть, а ki потом, похоже, бетами названы. И непонятно, почему коэффициенты должны быть разными, а не одним (вынесенным за сумму отношений) - откуда асимметрия?Я предполагаю, что предпочтение конкретного биотопа зависит от его кормовой благоприятности относительно других биотопов (обозначенных 1-i):
PA = k1*FA/Fi + ... + ki*FA/Fi,
где Fi - обилие кормов в биотопе i, ki - коэффициенты (не меняющиеся в течение сезона).
насчет зависимой переменной - нужно смотреть на данные, можно ли использовать нормальную (Гауссовскую) аппроксимацию. И непонятно, нужно ли моделировать численность, или вероятность выбора данного биотопа (использовать биномиальную модель).ВОПРОСЫ
1. Можно ли использовать относительные показатели (PA, FA/Fi) в качестве зависимых и независимых переменных множественной линейной регрессии? Следует ли применить логарифмическую трансформацию?
Насчет независимых - непонятно, может и разность логарифмов лучше использовать. Можно вообще рассматривать сигмоид от отношения обилия кормов как вероятность выбора данного биотопа, и брать произведение таких вероятностей, а параметры сигмоида рассматривать как параметры модели вместо k_i. Если эти параметры рассматривать не как константы, не зависящие от биотопов, а как случайные величины (т.е. делать модель со случайными эффектами), то можно компенсировать априорное различие биотопов по привлекательности. А если есть данные о пространственном положении, и биотопы расположены по соседству, можно и пространственную корреляцию компенсировать. В общем, можно несколько моделек соорудить, и статейку написать
конечно можно. Только не для обычной регрессии, которая сидит на кнопке в обычной программе. Нужно нормальную модель писать, и использовать Байесовские методы, там любые ограничения выписываются явно. При этом не факт, что модель должна иметь указанный вид - нужно какое-то обоснование, почему сумма, почему коэффициенты разные, и т.д..2. Я предполагаю, что связь между обилием кормов и предпочтением биотопа всегда неотрицательна, и данные это подтверждают. Тем не менее, при вычислении регрессии (по уравнению, представленному выше) некоторые из бета-коэффициентов отрицательные. Как я понимаю, биологического смысла такой результат не имеет. Можно ли как-то задать ограничения на допустимые значения бета-коэффициентов?
-
- Интересующийся
- Сообщения: 29
- Зарегистрирован: 29 окт 2014, 17:48
- Репутация: 0
Re: "Соотношение" в качестве переменной регрессионного анали
Спасибо за ответ!
Похоже, это именно то, что вы ниже назвали "априорными предпочтениями". Проблема еще в том, что в течение сезона они, скорее всего, тоже не совсем постоянны.
А что делать, приходится... Численности достаточно велики (в основном с массовыми видами имеем дело), их оценка достаточно надежна (усреднена за несколько лет), а площади сопоставимы (5 основных типов местообитаний). Так или иначе, мерилом предпочтения служит именно плотность, а не численность, которая зависит также от представленности биотопа в ландшафте. Впрочем, в описанном примере местообитания рассматриваются по отдельности, и в этом случае в качестве показателя сезонного предпочтения можно использовать и долю численности птиц, использующих данное местообитание.gamm писал(а):с плотностями работать нехорошо, разве только у вас численности гигантские и площади одинаковые. Для работы с счетчиками придуманы распределения Пуассона и Negative Binomial
Да, прошу прощения, опечатки.что-то странное у вас написано, проверьте - видимо, в первом слагаемом FA/F1 должно быть, а ki потом, похоже, бетами названы.
Дело в том, что изменения обилия кормов в разных биотопах могут иметь разную значимость для птиц. Скажем, десятикратное увеличение обилия корма на лугу практически никак не скажется на предпочтении ельника, поскольку луг малопригоден для обитания лесных птиц. А двукратное увеличение обилия корма в ивняке может привести к тому, что многие птицы покинут ельник и переместятся в ивняк.И непонятно, почему коэффициенты должны быть разными, а не одним (вынесенным за сумму отношений) - откуда асимметрия?
Похоже, это именно то, что вы ниже назвали "априорными предпочтениями". Проблема еще в том, что в течение сезона они, скорее всего, тоже не совсем постоянны.
Звучит заманчиво Сигмоид - это в смысле подгонять логистическую кривую вместо прямой? Это я примерно представляю, а вот случайные эффекты, пространственная корреляция и проч. - пока нет, попробую поискать литературу...Насчет независимых - непонятно, может и разность логарифмов лучше использовать. Можно вообще рассматривать сигмоид от отношения обилия кормов как вероятность выбора данного биотопа, и брать произведение таких вероятностей, а параметры сигмоида рассматривать как параметры модели вместо k_i. Если эти параметры рассматривать не как константы, не зависящие от биотопов, а как случайные величины (т.е. делать модель со случайными эффектами), то можно компенсировать априорное различие биотопов по привлекательности. А если есть данные о пространственном положении, и биотопы расположены по соседству, можно и пространственную корреляцию компенсировать. В общем, можно несколько моделек соорудить, и статейку написать
>>> Odd-Bird.do.am — Библиография научных работ о птицах России <<<
-
- Гуру
- Сообщения: 4069
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1064
- Ваше звание: программист
- Откуда: Казань
Re: "Соотношение" в качестве переменной регрессионного анали
там тоже плотность, но по другому записанная - там логарифмическая функция связи, и offset. Для счетчиков проблема в том, что дисперсия пропорциональна среднему, и это нужно учитывать. А при вычислении плотности дисперсия искажается, если площади разные.Odd-Bird писал(а): Так или иначе, мерилом предпочтения служит именно плотность, а не численность
тоже offset. При этом модель должна строиться по описаниям, не объединяя их по экотопам/биотопам. И если описания за разные годы - тоже учесть в модели.которая зависит также от представленности биотопа в ландшафте.
ясно, у вас на самом деле индексируются виды корма, а не местообитания. И вам нужно как-то учесть "коэффициент замещения" одного вида корма другимДело в том, что изменения обилия кормов в разных биотопах могут иметь разную значимость для птиц. Скажем, десятикратное увеличение обилия корма на лугу практически никак не скажется на предпочтении ельника, поскольку луг малопригоден для обитания лесных птиц.
если измерений несколько, то тоже в модель, как случайные эффекты. Если бы была схема сбора данных, то было бы понятнее (схема сбора исходных данных, до всяких пересчетов и агрегаций).Проблема еще в том, что в течение сезона они, скорее всего, тоже не совсем постоянны.
нет, произведение логистических регрессий - предполагаем, что предпочтение есть вероятностный процесс, попарные предпочтения независимы, и получаем вероятность выбора как произведение попарных вероятностей.Звучит заманчиво Сигмоид - это в смысле подгонять логистическую кривую вместо прямой?
В общем, если будет описание схемы сбора исходных данных, можно попробовать написать модель.
-
- Интересующийся
- Сообщения: 29
- Зарегистрирован: 29 окт 2014, 17:48
- Репутация: 0
Re: "Соотношение" в качестве переменной регрессионного анали
Отправил личное сообщение.
Думаю, дело не столько в видах корма (в принципе, сам корм может быть примерно одним и тем же в разных биотопах), сколько в условиях его сбора. Скажем, виды, приспособленные для сбора насекомых на голой почве, не любят кормиться в густой траве, но если там вдруг появляется очень много корма - то это может скомпенсировать неудобство его сбора. Кроме того, значение имеют и "некормовые" свойства местообитаний, например защищенность от хищников.у вас на самом деле индексируются виды корма, а не местообитания. И вам нужно как-то учесть "коэффициент замещения" одного вида корма другим
Исходные данные представлены в виде показателей обилия для отдельных 250-м отрезков (разумеется, у этих показателей очень большая стандартная ошибка).При этом модель должна строиться по описаниям, не объединяя их по экотопам/биотопам. И если описания за разные годы - тоже учесть в модели.
>>> Odd-Bird.do.am — Библиография научных работ о птицах России <<<
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость