Odd-Bird писал(а):Я изучаю связь между сезонным предпочтением птицами различных биотопов и обилием корма в них. Показатель предпочтения биотопа А вычисляется как:
PA = DA / Dmean,
где DA - плотность населения птиц в данном биотопе, Dmean - средняя плотность населения птиц в регионе.
с плотностями работать нехорошо, разве только у вас численности гигантские и площади одинаковые. Для работы с счетчиками придуманы распределения Пуассона и Negative Binomial
Я предполагаю, что предпочтение конкретного биотопа зависит от его кормовой благоприятности относительно других биотопов (обозначенных 1-i):
PA = k1*FA/Fi + ... + ki*FA/Fi,
где Fi - обилие кормов в биотопе i, ki - коэффициенты (не меняющиеся в течение сезона).
что-то странное у вас написано, проверьте - видимо, в первом слагаемом F
A/F
1 должно быть, а k
i потом, похоже, бетами названы. И непонятно, почему коэффициенты должны быть разными, а не одним (вынесенным за сумму отношений) - откуда асимметрия?
ВОПРОСЫ
1. Можно ли использовать относительные показатели (P
A, F
A/F
i) в качестве зависимых и независимых переменных множественной линейной регрессии? Следует ли применить логарифмическую трансформацию?
насчет зависимой переменной - нужно смотреть на данные, можно ли использовать нормальную (Гауссовскую) аппроксимацию. И непонятно, нужно ли моделировать численность, или вероятность выбора данного биотопа (использовать биномиальную модель).
Насчет независимых - непонятно, может и разность логарифмов лучше использовать. Можно вообще рассматривать сигмоид от отношения обилия кормов как вероятность выбора данного биотопа, и брать произведение таких вероятностей, а параметры сигмоида рассматривать как параметры модели вместо k_i. Если эти параметры рассматривать не как константы, не зависящие от биотопов, а как случайные величины (т.е. делать модель со случайными эффектами), то можно компенсировать априорное различие биотопов по привлекательности. А если есть данные о пространственном положении, и биотопы расположены по соседству, можно и пространственную корреляцию компенсировать. В общем, можно несколько моделек соорудить, и статейку написать
2. Я предполагаю, что связь между обилием кормов и предпочтением биотопа всегда неотрицательна, и данные это подтверждают. Тем не менее, при вычислении регрессии (по уравнению, представленному выше) некоторые из бета-коэффициентов отрицательные. Как я понимаю, биологического смысла такой результат не имеет. Можно ли как-то задать ограничения на допустимые значения бета-коэффициентов?
конечно можно. Только не для обычной регрессии, которая сидит на кнопке в обычной программе. Нужно нормальную модель писать, и использовать Байесовские методы, там любые ограничения выписываются явно. При этом не факт, что модель должна иметь указанный вид - нужно какое-то обоснование, почему сумма, почему коэффициенты разные, и т.д..