Вопросы по вегетационным индексам и pixel aggregation

Не знаете, где задать вопрос? Задавайте здесь.
Ответить
Земляничка
Новоприбывший
Сообщения: 2
Зарегистрирован: 23 апр 2014, 21:27
Репутация: 0

Вопросы по вегетационным индексам и pixel aggregation

Сообщение Земляничка » 23 апр 2014, 22:40

Здравствуйте, помогите пожалуйста новичку :oops:
Суть задания, которое я делала, в том, чтобы применить данные полевого описания лесных массивов для извлечения информации из данных ДЗЗ. Использовались снимки Landsat 5 с атмосферной коррекцией и .csv файл с forest inventory data по ряду параметров (координаты, stand density, median tree height, diameter at breast height, percentage abundance of pine, spruce and birch и leaf area index) для данной территории.
При помощи GRASS, в QGIS были добавлены данные лесотаксации (точечный слой). Далее, были посчитаны вегетационные индексы SR, NDVI и NDWI, а полученные карты были сглажены с помощью n.neighbors (3х3, среднее из 9 пикселей, хотя почему брали именно 9 - я не понимаю), чтобы таксационные данные на уровне лесных массивов были соразмерны с 30м пикселями Landsat, надо так понимать :?: .
Потом данные вегетационных индексов были извлечены по векторным точкам в .csv файл (через v.what.rast), после чего в Excel были построены точечные графики с уравнениями линейных трендов. Коэффициенты полученного уравнения для NDVI-LAI были использованы для моделирования линейной регрессии применительно к данным таксации (r.mapcalc "FI = float(A*NDVI_smooth + B)").
Ниже две попытки визуализировать результат (применение линейной модели с коэффициентами от NDVI-LAI к таксационным данным).
NDVI pseudocolor, stretched min-max
NDVI pseudocolor

Помимо критики финальной картинки, что тоже приветствуется, есть следующие вопросы, на которые я затрудняюсь ответить:
1) Почему использовалась именно 3х3 рамка для сглаживания, и какой тип математических функций применяется для агрегации значений пикселей, если нужно представить данные по категориям (например, land cover type)?
2) Как можно улучшить визуальное представление результатов? И можно ли извлечь и применить такие же зависимости для данных ДЗЗ среднего или низкого пространственного разрешения (напр., MODIS 500m с атм. коррекцией)
3) В целом, R^2 в уравнениях линейной тенденции между разными вег. индексами и параметрами лесотаксации едва достигали 0,3 (0,299 - максимальное значение). В чем может быть причина такой слабой связи, и как можно было бы улучшить полевые данные, например?

Надеюсь, что описала последовательность и вопросы достаточно детально. Всем заранее большое спасибо за помощь.

gamm
Гуру
Сообщения: 4168
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1107
Ваше звание: программист
Откуда: Казань

Re: Вопросы по вегетационным индексам и pixel aggregation

Сообщение gamm » 24 апр 2014, 04:08

вся ваша последовательность имеет смысл только для построения "картинок", как верно указано.

1) Любая ГИС вообще годится в основном для быстрого получения разных картинок (прикидок) на качественном уровне, для нормального количественного анализа нужно данные вытаскивать в табличном виде, и анализировать в нормальной статистической среде. К Арке для этого традиционно подключали S-PLUS, который есть в бесплатном варианте под именем R. Нужно вытаскивать из снимков окрестность точечных данных, и анализировать (чтобы учесть неточность позиционирования точек, пространственную корреляцию и т.д.).

2) Построение простых линейных моделей - тоже только прикидка, но уже статистическая. Нужно делать нормальный анализ зависимостей, и строить адекватную модель. Какая она получится, зависит от от данных, для некоторых показателей прямых зависимостей нет, нужно искать косвенные, через классификацию и сегментацию снимков. Готовых кнопок, решающих все задачи, нет.

Аватара пользователя
nadiopt
Гуру
Сообщения: 4744
Зарегистрирован: 29 янв 2009, 13:27
Репутация: 495
Ваше звание: хрюкало
Откуда: Санкт-Петербург
Контактная информация:

Re: Вопросы по вегетационным индексам и pixel aggregation

Сообщение nadiopt » 24 апр 2014, 07:59

еще раз подтверждается мое глубокое убеждение, чито линейная регрессия для анализа связи дзз и таксации нафиг неприменима, ну куда годится 0.3? и что значит улучшить полевые данные, это уже подгонка получится. надо искать другие зависимости.

[ Сообщение с мобильного устройства ]
ин гроссен фамилен нихт клювен клац клац

KolesovDmitry
Гуру
Сообщения: 810
Зарегистрирован: 22 авг 2007, 14:58
Репутация: 123
Откуда: Казань

Re: Вопросы по вегетационным индексам и pixel aggregation

Сообщение KolesovDmitry » 24 апр 2014, 08:13

Земляничка писал(а):...полученные карты были сглажены с помощью n.neighbors (3х3, среднее из 9 пикселей, хотя почему брали именно 9 - я не понимаю)
Погодите минутку. Кто эти "они", которые брали окрестность в 9 пикселей? Разве анализ делали не вы?
Земляничка писал(а): 1) Почему использовалась именно 3х3 рамка для сглаживания, и какой тип математических функций применяется для агрегации значений пикселей, если нужно представить данные по категориям (например, land cover type)?
Размер окрестности можно выставить любой нечетный (5x5, 7x7, ...), а не только 3x3 -- посмотрите параметры модуля r.neighbors.
По умолчанию используется усреднение значений пикселей, попавших в окно. Но доступно также несколько других функций помимо среднего (см. документацию по ссылке выше). Для категориальных данных, видимо, есть смысл в применении только моды.

Если вам не хватает тех функций, которые предоставляются r.neighbors, то вы можете исползовать r.mapcalc -- там функции ограничены только вашей фантазией ) Также r.mapcalc поддерживает обработку окрестностей любых форм --- смотрите документацию по этому модулю. При необходимости из r.mapcalc можно создать очень сложную логику, но в описании модуля на сайте этого нет, нужно лезть в статьи по ссылкам внизу описания.
Земляничка писал(а): 2) Как можно улучшить визуальное представление результатов? И можно ли извлечь и применить такие же зависимости для данных ДЗЗ среднего или низкого пространственного разрешения (напр., MODIS 500m с атм. коррекцией)
Примените к полученным индексам цветовую схему ndvi через r.colors, визуально будет лучше восприниматься.
Земляничка писал(а): 3) В целом, R^2 в уравнениях линейной тенденции между разными вег. индексами и параметрами лесотаксации едва достигали 0,3 (0,299 - максимальное значение). В чем может быть причина такой слабой связи, и как можно было бы улучшить полевые данные, например?
Об этом уже отписался gamm. Но просто к сведению
1) Линейную регрессию можно посчитать и сразу в GRASS, импорта-экспорта в excel не требуется
2) Для серьезного анализа и к GRASS, и к QGIS можно подключать R:
(а) Для GRASS пример взаимодействия тут: http://gis-lab.info/qa/grass-r.html
(б) Для QGIS нужно использовать модуль processing (sextante), краткое описание дается тут: http://www.qgis.org/ru/docs/user_manual ... -r-scripts

Земляничка
Новоприбывший
Сообщения: 2
Зарегистрирован: 23 апр 2014, 21:27
Репутация: 0

Re: Вопросы по вегетационным индексам и pixel aggregation

Сообщение Земляничка » 24 апр 2014, 09:29

Спасибо всем за комментарии, как говорится, я только учусь :) Поэтому, как правильно заметили, приведенный пример довольно примитивный и топорный.

gamm, спасибо, тогда поищу дополнительную информацию, в частности об интеграции R в QGIS.

nadiopt, спасибо, подумаю над этим.

KolesovDmitry, я прохожу базовый курс по ДЗЗ и делала анализ соответственно инструкции, где задано 3х3. Я погуглила, какие еще могут быть параметры, но какого-либо rule of thumb для выбора не обнаружила. И поскольку в инструкции причина этого выбора не была объяснена, я и заинтересовалась, почему именно 3х3 в данном случае. Спасибо за детальное описание и примеры, сейчас почитаю.

gamm
Гуру
Сообщения: 4168
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1107
Ваше звание: программист
Откуда: Казань

Re: Вопросы по вегетационным индексам и pixel aggregation

Сообщение gamm » 24 апр 2014, 13:00

Земляничка писал(а):поищу дополнительную информацию, в частности об интеграции R в QGIS.
интеграция сводится к тому, чтобы научиться строить выборки и выводить их в табличном виде. А все расчеты (не прикидки) нужно делать в пригодной для этого статистической среде. Строго говоря, для работы в R никакие ГИС вообще не нужны, поскольку он и сам умеет читать и растровые, и векторные данные (через тот же GDAL/OGR). А также строить красивые картинки :-)

Из статистических сред для нашего человека доступен фактически только R, поскольку и SAS, и STATA, и прочие проф. статистические среды стоят не меньше Аркинфо, а литературы по ним гораздо меньше, чем по бесплатному R с теми же возможностями.

А всякие уиндовс-поделия типа STATGRAPH или Statistica годятся в основном для прикидки и обучения студентов основам, поскольку имеют жестко заданный, а потому ограниченный, набор моделей.

что касается прикидок. Линейную регрессию посчитать в разных Секстантах конечно можно, а вот проверить ее адекватность - нет. Сам по себе коэффициент корреляции ни о чем не говорит, если у вас сильный абсолютно случайный процесс, а на его фоне - что-то закономерное, но малозаметное, то регрессия эту закономерность поймает как абсолютно значимую, однако коэффициент корреляции будет около нуля. И ничего улучшить нельзя, поскольку основной процесс случайный.

Однако даже для случайного процесса могут быть выявлены зависимости, только не самого целевого значения от факторов, а например его дисперсии, или направления пространственной корреляции, или изменения параметров распределения, которые несут важную экологическую информацию. В общем, построение статистической модели не есть вычисление коэффициентов линейной регрессии, а есть построение модели. И главный критерий ее качества - возможность по этой модели получить (генерировать) картину пространственного распределения, которую даже эксперт не отличит от настоящей (пример из игрушек - генерация правдоподобных ландшафтов). Как-то так :-)

Ответить

Вернуться в «Я новичок!»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 12 гостей