корреляции
-
- Активный участник
- Сообщения: 143
- Зарегистрирован: 10 мар 2004, 08:07
- Репутация: 10
- Откуда: Redlands
- Контактная информация:
корреляции
mettus, а какой показатель Вы снимаете в райцентрах? Напрашивается следующий алгоритм решения проблемы:
1) интерполировать поверхность показателей (grid) атмосферы
2) интерполировать поверхность показателей (тоже grid) по райцентрам
3) провести корр. анализ
С (1) более-менее понятно. А с (2), вообще имеет смысл интерполировать поверхность? Просто пока из постановки задачи не ясно. Но если да, то при построении поверхности я бы придерживался метода IDW.
Ну а с (3) все будет просто, когда sim выложит обещанную методику.
Хотя опять-таки, насколько я понимаю, чтобы корреляционный анализ был корректен, нужно и шаги 1-2 выполнять как-то умно, в смысле выбора методики построения пов-тей??
1) интерполировать поверхность показателей (grid) атмосферы
2) интерполировать поверхность показателей (тоже grid) по райцентрам
3) провести корр. анализ
С (1) более-менее понятно. А с (2), вообще имеет смысл интерполировать поверхность? Просто пока из постановки задачи не ясно. Но если да, то при построении поверхности я бы придерживался метода IDW.
Ну а с (3) все будет просто, когда sim выложит обещанную методику.
Хотя опять-таки, насколько я понимаю, чтобы корреляционный анализ был корректен, нужно и шаги 1-2 выполнять как-то умно, в смысле выбора методики построения пов-тей??
для yumakaev'а:
спасибо...
1. Методологически тут не подкопаться - метеорологические параметры это непрерывное поле признака...классический случай Пользовался методом IDW - в Мап инфо их два - идв и на основе tin - т.е. особого выбора не было
2. Это показатели заболеваемости по административным районам (соответственно это у меня какбы картограммы) - интерполировать по ним поверхность довольно спорная идея,
чем больше чешу репу на эту тему, тем больше склоняюсь к этой мысли...
Вот и у Вас такая же мысль появилась...
Вот если правда поместить точки от которых идёт интерполяция в места максимальной концентрации населения...
Думаю пока в общем...
А почему, кстати для этого максимально подходит метод IDW?
В данный момент мне кажется что наиболее правильно (и просто) будет получить выборку с картограмм в местах максимальной концентрации населения.
В этих же местах получить значения интерполированных метеорологических параметров...
А потом повертеть эти данные в статистической программе.
Выборка правда получится маленькая - соответственно надо пользоваться непараметрическими коэфф корреляции.
Так что задачу можно например несколько переформулировать - как получить выборку в конкретных точках - одновременно по картограммам и интерполированным поверхностям.
Хотя и корреляции между поверхностями тоже интересны...
надо и так и так попробовать
Спасибо
Всего хорошего
[/quote]
спасибо...
1. Методологически тут не подкопаться - метеорологические параметры это непрерывное поле признака...классический случай Пользовался методом IDW - в Мап инфо их два - идв и на основе tin - т.е. особого выбора не было
2. Это показатели заболеваемости по административным районам (соответственно это у меня какбы картограммы) - интерполировать по ним поверхность довольно спорная идея,
чем больше чешу репу на эту тему, тем больше склоняюсь к этой мысли...
Вот и у Вас такая же мысль появилась...
Вот если правда поместить точки от которых идёт интерполяция в места максимальной концентрации населения...
Думаю пока в общем...
А почему, кстати для этого максимально подходит метод IDW?
В данный момент мне кажется что наиболее правильно (и просто) будет получить выборку с картограмм в местах максимальной концентрации населения.
В этих же местах получить значения интерполированных метеорологических параметров...
А потом повертеть эти данные в статистической программе.
Выборка правда получится маленькая - соответственно надо пользоваться непараметрическими коэфф корреляции.
Так что задачу можно например несколько переформулировать - как получить выборку в конкретных точках - одновременно по картограммам и интерполированным поверхностям.
Хотя и корреляции между поверхностями тоже интересны...
надо и так и так попробовать
Спасибо
Всего хорошего
[/quote]
для yumakaev'а:
спасибо...
1. Методологически тут не подкопаться - метеорологические параметры это непрерывное поле признака...классический случай Пользовался методом IDW - в Мап инфо их два - идв и на основе tin - т.е. особого выбора не было
2. Это показатели заболеваемости по административным районам (соответственно это у меня какбы картограммы) - интерполировать по ним поверхность довольно спорная идея,
чем больше чешу репу на эту тему, тем больше склоняюсь к этой мысли...
Вот и у Вас такая же мысль появилась...
Вот если правда поместить точки от которых идёт интерполяция в места максимальной концентрации населения...
Думаю пока в общем...
А почему, кстати для этого максимально подходит метод IDW?
В данный момент мне кажется что наиболее правильно (и просто) будет получить выборку с картограмм в местах максимальной концентрации населения.
В этих же местах получить значения интерполированных метеорологических параметров...
А потом повертеть эти данные в статистической программе.
Выборка правда получится маленькая - соответственно надо пользоваться непараметрическими коэфф корреляции.
Так что задачу можно например несколько переформулировать - как получить выборку в конкретных точках - одновременно по картограммам и интерполированным поверхностям.
Хотя и корреляции между поверхностями тоже интересны...
надо и так и так попробовать
Спасибо
Всего хорошего
[/quote]
спасибо...
1. Методологически тут не подкопаться - метеорологические параметры это непрерывное поле признака...классический случай Пользовался методом IDW - в Мап инфо их два - идв и на основе tin - т.е. особого выбора не было
2. Это показатели заболеваемости по административным районам (соответственно это у меня какбы картограммы) - интерполировать по ним поверхность довольно спорная идея,
чем больше чешу репу на эту тему, тем больше склоняюсь к этой мысли...
Вот и у Вас такая же мысль появилась...
Вот если правда поместить точки от которых идёт интерполяция в места максимальной концентрации населения...
Думаю пока в общем...
А почему, кстати для этого максимально подходит метод IDW?
В данный момент мне кажется что наиболее правильно (и просто) будет получить выборку с картограмм в местах максимальной концентрации населения.
В этих же местах получить значения интерполированных метеорологических параметров...
А потом повертеть эти данные в статистической программе.
Выборка правда получится маленькая - соответственно надо пользоваться непараметрическими коэфф корреляции.
Так что задачу можно например несколько переформулировать - как получить выборку в конкретных точках - одновременно по картограммам и интерполированным поверхностям.
Хотя и корреляции между поверхностями тоже интересны...
надо и так и так попробовать
Спасибо
Всего хорошего
[/quote]
-
- Активный участник
- Сообщения: 143
- Зарегистрирован: 10 мар 2004, 08:07
- Репутация: 10
- Откуда: Redlands
- Контактная информация:
Выходит, не зря я сомневался насчет райцентров. Получается, что пространственная компонента показателя заболеваний неопределённа. Т.е. заболевают люди в РАЗНЫХ нас. пунктах района (= в разных местах), а привязывается показатель к одному. Как тут строить пространственную корреляцию с поверхностью атмосферных показателей?
Мне представляется два допустимых варианта.
1) Попробовать "разогнать" данные по заболеваниям по конкретным нас.пунктам, по ним же (нас.пунктам) снять атмосф. показатели с интерполированной поверхности, и вертеть выборки в статистической программе.
2) Если нет возможности выполнить (1), то, раз уж мы берем обобщенный показатель по заболеваниям, то обобщаем и атмосферный показатель по р-нам (снова с поверхности), и опять в статпрограмму.
Возможно, в обоих случаях придется еще и нормализовать показатель заболеваемости по плотности населения.
Мне представляется два допустимых варианта.
1) Попробовать "разогнать" данные по заболеваниям по конкретным нас.пунктам, по ним же (нас.пунктам) снять атмосф. показатели с интерполированной поверхности, и вертеть выборки в статистической программе.
2) Если нет возможности выполнить (1), то, раз уж мы берем обобщенный показатель по заболеваниям, то обобщаем и атмосферный показатель по р-нам (снова с поверхности), и опять в статпрограмму.
Возможно, в обоих случаях придется еще и нормализовать показатель заболеваемости по плотности населения.
-
- Активный участник
- Сообщения: 143
- Зарегистрирован: 10 мар 2004, 08:07
- Репутация: 10
- Откуда: Redlands
- Контактная информация:
IDW
Учитывая характер данных, я, честно говоря, сомневаюсь в целесообразности построения поверхности по райцентрам вообще._mettus писал(а):Пользовался методом IDW - в Мап инфо их два - идв и на основе tin - т.е. особого выбора не было
...[skip]...
А почему, кстати для этого максимально подходит метод IDW?
Но в целом, вопрос "какой метод лучше при интерполяции поверхностей" - это большая проблема, я пока не видел толковой литературы на этот счет. Кстати, в ArcView Spatial Analyst их два - IDW и Spline (на основе TIN это уже другой модуль, 3D Analyst).
Я извиняюсь за подробности, которые кому-то могут показаться детсадовскими, но, раз уж задали вопрос........
В IDW точки, по которым строится поверхность, имеют тем бОльший вес при определении значения в интерполируемой ячейке, чем они (точки) ближе к этой ячейке. Поверхность получается менее гладкой. Классический пример - поверхность вероятности совершения покупок при удалении от точек концентрации населения. Мне вначале показалось, что ситуация с райцентрами похожа на этот пример, но теперь-то ясно, что это не так.
Про прочие особенности IDW, Spline (а также Kriging и т.д.), можно почитать в соответствующих документациях. Но там все-таки мало говорится про практическое применение методов. По моим соображениям, при построении поверхностей типа ЦМР или атмосферных показателей, имеет смысл сначала оценить, какова плотность исходных точек по отношению к выбранному размеру ячейки грида. Если точек не густо (т.е. точки могут быть неравномерно разбросаны по отношению к конкретной ячейке), то я бы использовал Spline. Если на каждую будущую ячейку приходится много близлежащих точек, то можно рассмотреть оба метода, поиграть.
Все это конечно очень размыто. Если у кого-то есть свои соображения на этот счет --- весьма интересно их узнать.
Есть статья на английском про оценку результатов интерполяции: http://www.innovativegis.com/basis/MapA ... Topic2.htm
Спасибо за "детсадовские подробности"...
А где малышу их ещё узнать, как не спросить у взрослого и мудрого воспитателя...?
1. Теоретичекая возможность поиметь данные о заболеваемости по отдельным населённым пунктам есть (она наличиствует в некой автоматизированной системе её сбора и обработки), а вот практически ... увы.
Ряд вопросов, разрешить которые весьма сложно (по крайней мере для меня).
Конечно, анализ был бы более корректным именно в таком случае...
Приходится работать с тем что удалось добыть.
2. Данные по заболеваемости представлены не в абсолютных числах (напр. 1000 заболеваний всего в районе) в промилле - т.е. уже пересчитаны на 1000 населения района (напр. 300 заболеваний на 1000 населения района).
Вы именно это имели в виду под нормировкой на плотность?
3. Расселение у нас такого характера - типа плотность населения в районе менее 10 чел на км2, и 2 населенных пункта по 10 000 - 20 000 чел., 6 сёл по 1000-3000 чел., 9 сёл по 100-500 чел.
В других побольше пунктов конечно - но максимальная плотность более 50 чел на км2 - в 2-х из 11 адм районов
Расселение в основном вдоль водной артерии по центру области.
Так что осреднять по территории района ... ммм... скорее по зоне расположения населённых пунктов...
А вот практически то как это воплотить?
Вот. Если что упустил - допишу потом
На занятия пора...
Всего хорошего.
А где малышу их ещё узнать, как не спросить у взрослого и мудрого воспитателя...?
1. Теоретичекая возможность поиметь данные о заболеваемости по отдельным населённым пунктам есть (она наличиствует в некой автоматизированной системе её сбора и обработки), а вот практически ... увы.
Ряд вопросов, разрешить которые весьма сложно (по крайней мере для меня).
Конечно, анализ был бы более корректным именно в таком случае...
Приходится работать с тем что удалось добыть.
2. Данные по заболеваемости представлены не в абсолютных числах (напр. 1000 заболеваний всего в районе) в промилле - т.е. уже пересчитаны на 1000 населения района (напр. 300 заболеваний на 1000 населения района).
Вы именно это имели в виду под нормировкой на плотность?
3. Расселение у нас такого характера - типа плотность населения в районе менее 10 чел на км2, и 2 населенных пункта по 10 000 - 20 000 чел., 6 сёл по 1000-3000 чел., 9 сёл по 100-500 чел.
В других побольше пунктов конечно - но максимальная плотность более 50 чел на км2 - в 2-х из 11 адм районов
Расселение в основном вдоль водной артерии по центру области.
Так что осреднять по территории района ... ммм... скорее по зоне расположения населённых пунктов...
А вот практически то как это воплотить?
Вот. Если что упустил - допишу потом
На занятия пора...
Всего хорошего.
-
- Активный участник
- Сообщения: 143
- Зарегистрирован: 10 мар 2004, 08:07
- Репутация: 10
- Откуда: Redlands
- Контактная информация:
mettus, я пока ничего нового не придумал, но в таком фоновом режиме продолжаю размышлять, вопрос-то интересный.
Пока, если интересно, можно почитать интересную статью про методы интерполяции поверхностей:
http://alphais.inep.ksc.ru/intercarto/s ... e/1110.htm
Статья была найдена в результате обсуждений на
http://www.dataplus.ru/Root/Forum/forum ... D=707&PN=1
Посмотрел там же переписку по вашему вопросу. Причем тут Assign Proximity, я не понимаю. Этот алгоритм присваивает каждой ячейке растра код ближайшего объекта из некоторой точечной темы (напр. метеостанции), таким образом, как-бы распределяя принадлежность территории этим объектам по признаку расстояния. Как это использовать в вашем случае, я не знаю, возможно, автор идеи просто предложил это в порядке мозгового штурма.
Пока, если интересно, можно почитать интересную статью про методы интерполяции поверхностей:
http://alphais.inep.ksc.ru/intercarto/s ... e/1110.htm
Статья была найдена в результате обсуждений на
http://www.dataplus.ru/Root/Forum/forum ... D=707&PN=1
Посмотрел там же переписку по вашему вопросу. Причем тут Assign Proximity, я не понимаю. Этот алгоритм присваивает каждой ячейке растра код ближайшего объекта из некоторой точечной темы (напр. метеостанции), таким образом, как-бы распределяя принадлежность территории этим объектам по признаку расстояния. Как это использовать в вашем случае, я не знаю, возможно, автор идеи просто предложил это в порядке мозгового штурма.
Re: IDW
"какой метод лучше при интерполяции поверхностей" - это большая проблема, я пока не видел толковой литературы на этот счет. Кстати, в ArcView Spatial Analyst их два - IDW и Spline (на основе TIN это уже другой модуль, 3D Analyst).
Я извиняюсь за подробности, которые кому-то могут показаться детсадовскими, но, раз уж задали вопрос........
В IDW точки, по которым строится поверхность, имеют тем бОльший вес при определении значения в интерполируемой ячейке, чем они (точки) ближе к этой ячейке. Поверхность получается менее гладкой. Классический пример - поверхность вероятности совершения покупок при удалении от точек концентрации населения. Мне вначале показалось, что ситуация с райцентрами похожа на этот пример, но теперь-то ясно, что это не так.
Про прочие особенности IDW, Spline (а также Kriging и т.д.), можно почитать в соответствующих документациях. Но там все-таки мало говорится про практическое применение методов. По моим соображениям, при построении поверхностей типа ЦМР или атмосферных показателей, имеет смысл сначала оценить, какова плотность исходных точек по отношению к выбранному размеру ячейки грида. Если точек не густо (т.е. точки могут быть неравномерно разбросаны по отношению к конкретной ячейке), то я бы использовал Spline. Если на каждую будущую ячейку приходится много близлежащих точек, то можно рассмотреть оба метода, поиграть.
Все это конечно очень размыто. Если у кого-то есть свои соображения на этот счет --- весьма интересно их узнать.
Есть статья на английском про оценку результатов интерполяции: http://www.innovativegis.com/basis/MapA ... Topic2.htm[/quote]
Я извиняюсь за подробности, которые кому-то могут показаться детсадовскими, но, раз уж задали вопрос........
В IDW точки, по которым строится поверхность, имеют тем бОльший вес при определении значения в интерполируемой ячейке, чем они (точки) ближе к этой ячейке. Поверхность получается менее гладкой. Классический пример - поверхность вероятности совершения покупок при удалении от точек концентрации населения. Мне вначале показалось, что ситуация с райцентрами похожа на этот пример, но теперь-то ясно, что это не так.
Про прочие особенности IDW, Spline (а также Kriging и т.д.), можно почитать в соответствующих документациях. Но там все-таки мало говорится про практическое применение методов. По моим соображениям, при построении поверхностей типа ЦМР или атмосферных показателей, имеет смысл сначала оценить, какова плотность исходных точек по отношению к выбранному размеру ячейки грида. Если точек не густо (т.е. точки могут быть неравномерно разбросаны по отношению к конкретной ячейке), то я бы использовал Spline. Если на каждую будущую ячейку приходится много близлежащих точек, то можно рассмотреть оба метода, поиграть.
Все это конечно очень размыто. Если у кого-то есть свои соображения на этот счет --- весьма интересно их узнать.
Есть статья на английском про оценку результатов интерполяции: http://www.innovativegis.com/basis/MapA ... Topic2.htm[/quote]
-
- Активный участник
- Сообщения: 143
- Зарегистрирован: 10 мар 2004, 08:07
- Репутация: 10
- Откуда: Redlands
- Контактная информация:
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя