1. Данные 2013-2017 по числу укусов клещей в административных районах области
2. Данные 2011-2017 по площади проведённых акарицидных обработок в административных районах области
Нужно ответить на основной вопрос: влияет ли интенсивность обработок на число укусов.
И что-то я запутался, как к этому подступиться.
Всяких графиков и карто=схем нарисовано море.
Показано, что районы имеют пространственные кластеры (на основании числа укусов путём локального индекса Морана)
Попробовал выполнить OLS:
(Forest, Grassland,Shrubland -- доля каждого типа Landcover для района на основе данных наших китайских товарищей с 30m_GLOB)
Код: Выделить всё
REGRESSION
----------
SUMMARY OF OUTPUT: ORDINARY LEAST SQUARES
-----------------------------------------
Data set : NN_2017
Weights matrix :Queen_contiguty
Dependent Variable : CASES Number of Observations: 49
Mean dependent var : 164.3265 Number of Variables : 10
S.D. dependent var : 223.6180 Degrees of Freedom : 39
R-squared : 0.9860
Adjusted R-squared : 0.9828
Sum squared residual: 33499.500 F-statistic : 306.1502
Sigma-square : 858.962 Prob(F-statistic) : 2.612e-33
S.E. of regression : 29.308 Log likelihood : -229.451
Sigma-square ML : 683.663 Akaike info criterion : 478.902
S.E of regression ML: 26.1470 Schwarz criterion : 497.820
------------------------------------------------------------------------------------
Variable Coefficient Std.Error t-Statistic Probability
------------------------------------------------------------------------------------
CONSTANT 17.9235983 20.9507635 0.8555105 0.3974942
Forest -0.3126488 0.2572745 -1.2152345 0.2315825
Grassland -1.2393232 1.3484190 -0.9190935 0.3636965
Shrubland 2.1098984 1.7604572 1.1984946 0.2379568
ACARID_2015 0.7697115 0.5988864 1.2852378 0.2062895
ACARID_2014 -0.0114729 0.3234011 -0.0354759 0.9718813
ACARID_2013 -1.5978458 0.6983871 -2.2879084 0.0276476
ACARID_2012 0.2199659 0.5290338 0.4157881 0.6798441
CASE_2016 0.3919278 0.0811383 4.8303660 0.0000214
CASE_2015 0.5922264 0.0827926 7.1531280 0.0000000
------------------------------------------------------------------------------------
REGRESSION DIAGNOSTICS
MULTICOLLINEARITY CONDITION NUMBER 28.629
TEST ON NORMALITY OF ERRORS
TEST DF VALUE PROB
Jarque-Bera 2 3.792 0.1501
DIAGNOSTICS FOR HETEROSKEDASTICITY
RANDOM COEFFICIENTS
TEST DF VALUE PROB
Breusch-Pagan test 9 53.482 0.0000
Koenker-Bassett test 9 32.339 0.0002
DIAGNOSTICS FOR SPATIAL DEPENDENCE
TEST MI/DF VALUE PROB
Moran's I (error) 0.2594 3.996 0.0001
Lagrange Multiplier (lag) 1 0.182 0.6693
Robust LM (lag) 1 0.001 0.9765
Lagrange Multiplier (error) 1 7.669 0.0056
Robust LM (error) 1 7.488 0.0062
Lagrange Multiplier (SARMA) 2 7.670 0.0216
================================ END OF REPORT =====================================
1. То самое влияние
2. Дать прогноз на следующий год.
И с ней начались проблемы.
Я понимаю, почему такой бешенный R2 (практически во всех районах наблюдается ежедгодный рост числа укусов, в итоге модель получается переобученная)
И далле у меня тупик ;(
Пните, плиз, в нужную сторону...
Заранее спасибо.
P.S. Было бы неплохо, наверное завести раздел на форуме типа "Общие вопросы обработки данных"....