bolotoved писал(а):а не порекомендуете ли какого-нибудь современного, но, вместе с тем, в достаточной степени разжеванного обзора различных методик по "пространственно-временному анализу влияния факторов". В последнее время я начал впадать в ступор от огромного и все разрастающегося арсенала методик и нужен ликбез по основным классам моделей.
боюсь, что таковые обзоры отсутствую в принципе. Более того, в основе большинства методик лежит примерно одинаковая математика.
в кратком изложении картина примерно такая:
- имеем Xi, пространственно распределенные covariates, которые могут быть непрерывными и категориальными (factor в терминологии R)
- имеем Y, который может быть вещественным, номинальным (неупорядоченные категории, например 2 - есть/нет), и упорядоченным категориальным
задача - построить функцию оценки для Y, Y'=f(X1,X2,...,Xn)
(I) если используются только значения в той же точке, то это обычная регрессия (только нужно помнить, что "линейная регрессия", которая в Ёкселе, это вообще не регрессия, а линейная модель регрессионной зависимости для независимой некоррелированной выборки с Гауссовым распределением ошибок, и разных моделей много). Все это можно почитать в книжках Zuur
написанных для не математиков, с примерами, и т.д.)
(II) если значения известны на дискретных полигонах, образующих планарное разбиение, и мы хотим учесть корреляцию с соседями, то используются модели autoconditional, autoregressive (Ord, J. K. 1975. “Estimation Methods for Spatial Interaction,”Journal of the American Statistical Association , 70, 120–126), можно искать по слову econometrics, это оно и есть. Все это, естественно, есть в R.
(III) если предполагается, что воздействие непрерывно распределено на территории, делается модель со случайными эффектами, порождающая аппроксимацию в некотором базисе, например сплайн. Просто строить сплайн нельзя, поскольку только использование случайных эффектов позволяет автоматически выбрать степень сглаживания. Что-то можно посмотреть в книжке Вуда (Wood S.N. (2006b) Generalized Additive Models: An Introduction with R. Chapman and Hall/CRC Press), реализация в пакете mgcv, R. У Зуура тоже много вариантов таких моделей.
(IV) если зависимости сложные, то строится Марковское случайное поле, здесь лучше всего использовать работы Rue, это тот самый упомянутый INLA (хотя и других вариантов много). С полями тяжелее всего, даже сходимость не всегда имеет место, а строить модель приходится несколько месяцев. Тут нужно погружаться - зато можно вставить в модель все, чего душа пожелает.
в общем, я бы посоветовал начать с первых двух книжек Зуура (если есть доступ к Springer, то там они есть в электронном виде), там систематическое и простое изложение моделирования
а все методики отличаются в основном вариантами, как параметры модели искать ...