корреляции

LAS · Сообщение **LAS** » 11 май 2004, 18:09

Если кто обиделся то извиняюсь. В форуме много хороших вещей оговаривается. Надо все писать с примерами, не все ж продвинутые.

yumakaev · Сообщение **yumakaev** » 11 май 2004, 20:51

mettus, а какой показатель Вы снимаете в райцентрах? Напрашивается следующий алгоритм решения проблемы:

1) интерполировать поверхность показателей (grid) атмосферы
2) интерполировать поверхность показателей (тоже grid) по райцентрам
3) провести корр. анализ

С (1) более-менее понятно. А с (2), вообще имеет смысл интерполировать поверхность? Просто пока из постановки задачи не ясно. Но если да, то при построении поверхности я бы придерживался метода IDW.

Ну а с (3) все будет просто, когда sim выложит обещанную методику.

Хотя опять-таки, насколько я понимаю, чтобы корреляционный анализ был корректен, нужно и шаги 1-2 выполнять как-то умно, в смысле выбора методики построения пов-тей??

LAS · Сообщение **LAS** » 12 май 2004, 18:26

Вот вот надо чтоб все было просчитано до мулиметра, и главное указано к чему все это применять.

_mettus · Сообщение **_mettus** » 13 май 2004, 11:19

для yumakaev'а:

спасибо...
1. Методологически тут не подкопаться - метеорологические параметры это непрерывное поле признака...классический случай

Пользовался методом IDW - в Мап инфо их два - идв и на основе tin - т.е. особого выбора не было
2. Это показатели заболеваемости по административным районам (соответственно это у меня какбы картограммы) - интерполировать по ним поверхность довольно спорная идея,
чем больше чешу репу на эту тему, тем больше склоняюсь к этой мысли...
Вот и у Вас такая же мысль появилась...
Вот если правда поместить точки от которых идёт интерполяция в места максимальной концентрации населения...
Думаю пока в общем...

А почему, кстати для этого максимально подходит метод IDW?

В данный момент мне кажется что наиболее правильно (и просто) будет получить выборку с картограмм в местах максимальной концентрации населения.
В этих же местах получить значения интерполированных метеорологических параметров...
А потом повертеть эти данные в статистической программе.
Выборка правда получится маленькая - соответственно надо пользоваться непараметрическими коэфф корреляции.

Так что задачу можно например несколько переформулировать - как получить выборку в конкретных точках - одновременно по картограммам и интерполированным поверхностям.
Хотя и корреляции между поверхностями тоже интересны...
надо и так и так попробовать

Спасибо
Всего хорошего

[/quote]

_mettus · Сообщение **_mettus** » 13 май 2004, 11:20

для yumakaev'а:

спасибо...
1. Методологически тут не подкопаться - метеорологические параметры это непрерывное поле признака...классический случай

Пользовался методом IDW - в Мап инфо их два - идв и на основе tin - т.е. особого выбора не было
2. Это показатели заболеваемости по административным районам (соответственно это у меня какбы картограммы) - интерполировать по ним поверхность довольно спорная идея,
чем больше чешу репу на эту тему, тем больше склоняюсь к этой мысли...
Вот и у Вас такая же мысль появилась...
Вот если правда поместить точки от которых идёт интерполяция в места максимальной концентрации населения...
Думаю пока в общем...

А почему, кстати для этого максимально подходит метод IDW?

В данный момент мне кажется что наиболее правильно (и просто) будет получить выборку с картограмм в местах максимальной концентрации населения.
В этих же местах получить значения интерполированных метеорологических параметров...
А потом повертеть эти данные в статистической программе.
Выборка правда получится маленькая - соответственно надо пользоваться непараметрическими коэфф корреляции.

Так что задачу можно например несколько переформулировать - как получить выборку в конкретных точках - одновременно по картограммам и интерполированным поверхностям.
Хотя и корреляции между поверхностями тоже интересны...
надо и так и так попробовать

Спасибо
Всего хорошего

[/quote]

yumakaev · Сообщение **yumakaev** » 16 май 2004, 04:04

Выходит, не зря я сомневался насчет райцентров. Получается, что пространственная компонента показателя заболеваний неопределённа. Т.е. заболевают люди в РАЗНЫХ нас. пунктах района (= в разных местах), а привязывается показатель к одному. Как тут строить пространственную корреляцию с поверхностью атмосферных показателей?

Мне представляется два допустимых варианта.

1) Попробовать "разогнать" данные по заболеваниям по конкретным нас.пунктам, по ним же (нас.пунктам) снять атмосф. показатели с интерполированной поверхности, и вертеть выборки в статистической программе.

2) Если нет возможности выполнить (1), то, раз уж мы берем обобщенный показатель по заболеваниям, то обобщаем и атмосферный показатель по р-нам (снова с поверхности), и опять в статпрограмму.

Возможно, в обоих случаях придется еще и нормализовать показатель заболеваемости по плотности населения.

yumakaev · Сообщение **yumakaev** » 18 май 2004, 20:51

_mettus писал(а):Пользовался методом IDW - в Мап инфо их два - идв и на основе tin - т.е. особого выбора не было
...[skip]...
А почему, кстати для этого максимально подходит метод IDW?

Учитывая характер данных, я, честно говоря, сомневаюсь в целесообразности построения поверхности по райцентрам вообще.

Но в целом, вопрос "какой метод лучше при интерполяции поверхностей" - это большая проблема, я пока не видел толковой литературы на этот счет. Кстати, в ArcView Spatial Analyst их два - IDW и Spline (на основе TIN это уже другой модуль, 3D Analyst).

Я извиняюсь за подробности, которые кому-то могут показаться детсадовскими, но, раз уж задали вопрос........

В IDW точки, по которым строится поверхность, имеют тем бОльший вес при определении значения в интерполируемой ячейке, чем они (точки) ближе к этой ячейке. Поверхность получается менее гладкой. Классический пример - поверхность вероятности совершения покупок при удалении от точек концентрации населения. Мне вначале показалось, что ситуация с райцентрами похожа на этот пример, но теперь-то ясно, что это не так.

Про прочие особенности IDW, Spline (а также Kriging и т.д.), можно почитать в соответствующих документациях. Но там все-таки мало говорится про практическое применение методов. По моим соображениям, при построении поверхностей типа ЦМР или атмосферных показателей, имеет смысл сначала оценить, какова плотность исходных точек по отношению к выбранному размеру ячейки грида. Если точек не густо (т.е. точки могут быть неравномерно разбросаны по отношению к конкретной ячейке), то я бы использовал Spline. Если на каждую будущую ячейку приходится много близлежащих точек, то можно рассмотреть оба метода, поиграть.

Все это конечно очень размыто. Если у кого-то есть свои соображения на этот счет --- весьма интересно их узнать.

Есть статья на английском про оценку результатов интерполяции: http://www.innovativegis.com/basis/MapA ... Topic2.htm

_mettus · Сообщение **_mettus** » 20 май 2004, 12:44

Спасибо за "детсадовские подробности"...

А где малышу их ещё узнать, как не спросить у взрослого и мудрого воспитателя...?

1. Теоретичекая возможность поиметь данные о заболеваемости по отдельным населённым пунктам есть (она наличиствует в некой автоматизированной системе её сбора и обработки), а вот практически ... увы.
Ряд вопросов, разрешить которые весьма сложно (по крайней мере для меня).
Конечно, анализ был бы более корректным именно в таком случае...
Приходится работать с тем что удалось добыть.

2. Данные по заболеваемости представлены не в абсолютных числах (напр. 1000 заболеваний всего в районе) в промилле - т.е. уже пересчитаны на 1000 населения района (напр. 300 заболеваний на 1000 населения района).
Вы именно это имели в виду под нормировкой на плотность?

3. Расселение у нас такого характера - типа плотность населения в районе менее 10 чел на км2, и 2 населенных пункта по 10 000 - 20 000 чел., 6 сёл по 1000-3000 чел., 9 сёл по 100-500 чел.
В других побольше пунктов конечно - но максимальная плотность более 50 чел на км2 - в 2-х из 11 адм районов

Расселение в основном вдоль водной артерии по центру области.
Так что осреднять по территории района ... ммм... скорее по зоне расположения населённых пунктов...
А вот практически то как это воплотить?

Вот. Если что упустил - допишу потом

На занятия пора...

Всего хорошего.

yumakaev · Сообщение **yumakaev** » 28 май 2004, 22:33

mettus, я пока ничего нового не придумал, но в таком фоновом режиме продолжаю размышлять, вопрос-то интересный.

Пока, если интересно, можно почитать интересную статью про методы интерполяции поверхностей:
http://alphais.inep.ksc.ru/intercarto/s ... e/1110.htm

Статья была найдена в результате обсуждений на
http://www.dataplus.ru/Root/Forum/forum ... D=707&PN=1

Посмотрел там же переписку по вашему вопросу. Причем тут Assign Proximity, я не понимаю. Этот алгоритм присваивает каждой ячейке растра код ближайшего объекта из некоторой точечной темы (напр. метеостанции), таким образом, как-бы распределяя принадлежность территории этим объектам по признаку расстояния. Как это использовать в вашем случае, я не знаю, возможно, автор идеи просто предложил это в порядке мозгового штурма.

Гость · Сообщение **Гость** » 21 авг 2004, 16:57

"какой метод лучше при интерполяции поверхностей" - это большая проблема, я пока не видел толковой литературы на этот счет. Кстати, в ArcView Spatial Analyst их два - IDW и Spline (на основе TIN это уже другой модуль, 3D Analyst).

Я извиняюсь за подробности, которые кому-то могут показаться детсадовскими, но, раз уж задали вопрос........

В IDW точки, по которым строится поверхность, имеют тем бОльший вес при определении значения в интерполируемой ячейке, чем они (точки) ближе к этой ячейке. Поверхность получается менее гладкой. Классический пример - поверхность вероятности совершения покупок при удалении от точек концентрации населения. Мне вначале показалось, что ситуация с райцентрами похожа на этот пример, но теперь-то ясно, что это не так.

Про прочие особенности IDW, Spline (а также Kriging и т.д.), можно почитать в соответствующих документациях. Но там все-таки мало говорится про практическое применение методов. По моим соображениям, при построении поверхностей типа ЦМР или атмосферных показателей, имеет смысл сначала оценить, какова плотность исходных точек по отношению к выбранному размеру ячейки грида. Если точек не густо (т.е. точки могут быть неравномерно разбросаны по отношению к конкретной ячейке), то я бы использовал Spline. Если на каждую будущую ячейку приходится много близлежащих точек, то можно рассмотреть оба метода, поиграть.

Все это конечно очень размыто. Если у кого-то есть свои соображения на этот счет --- весьма интересно их узнать.

Есть статья на английском про оценку результатов интерполяции: http://www.innovativegis.com/basis/MapA ... Topic2.htm[/quote]

yumakaev · Сообщение **yumakaev** » 21 авг 2004, 19:28

Гость - спасибо, что так подробно меня процитировали

Форумы GIS-Lab.info

корреляции

корреляции

IDW

Re: IDW

Кто сейчас на конференции