Вопрос по статистике в R

Вопросы общего характера по ГИС и дистанционному зондированию, не связанные с конкретным ПО.
Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Вопрос по статистике в R

Сообщение Natalia Novoselova » 14 окт 2014, 08:17

Очень простой вопрос по статистике и R (для тех, кто разбирается и в том и в другом). Я совершенно не разбираюсь, но очень хочу хоть как-то этому научиться. Как всегда, учиться приходиться сразу на деле.


Есть 3 выборки:
A (территории с древесными видами-экзотами)
B (территории с травяными видами-экзотами)
С (территории без видов экзотов)

Каждая территория будет представлена (так мы планируем) площадками 5x5 метров в числе 10 на каждую выборку.

И для каждой такой площадки будут определяться параметры. Всего их будет четыре.
– два определяемых в поле: z1 число местных видов на площадке, z2 - коэф. толщины деревьев (сумма деревьев с d>50 cm / сумма деревьев с d<50 cm).
и два определяемых через Landsat8: z3 - NDVI, z4 - температура поверхности.

Задаю гипотезы, на которую ищу ответ.

Гипотеза 1. Точнее несколько однотипных, на каждый параметр z своя гипотеза)
В выборке А и B параметры z1, z2, z3 - меньше, чем в выборке C


Гипотеза2
При уменьшении биоразнообразия (т.е. числа разных видов на площадке) - NDVI этой площадки уменьшается



Какой статистический тест следует выбрать на 2 этих случая? Задача – определить статистически значимо, подтверждается гипотеза или нет.
Это нужно сделать в R (тут бы хорошо сказать чем там сразу это можно сделать. Я сразу изучу это и потренируюсь с кодом)

Всё это – есть проект, который нужно делать самостоятельно. То есть эти идеи - мои собственные (индекс толщины деревьев также, не знаю, есть ли что-то такое).


У меня проблема – сильный пробел (и неуверенность в себе) в вопросах статистики. Потому (хоть сама, конечно, тоже буду думать), задаю вопросом здесь, чтобы повысить шанс, узнать про это больше и лучше.

P.S. Понимаю, что у меня не хватает базовых знаний и не сформировано адекватное "статистическое " мышление. Но просто читать учебники - мне мало дает (там слишком сложно). Однако вижу вокруг, что люди берут простые тесты и быстро их используют (ну как инструменты) под каждый случай (задача экологии). Может это и простой уровень, по мне бы до такого дойти.
Последний раз редактировалось Natalia Novoselova 14 окт 2014, 08:27, всего редактировалось 1 раз.

Аватара пользователя
nadiopt
Гуру
Сообщения: 4744
Зарегистрирован: 29 янв 2009, 13:27
Репутация: 495
Ваше звание: хрюкало
Откуда: Санкт-Петербург
Контактная информация:

Re: Вопрос по статистике в R

Сообщение nadiopt » 14 окт 2014, 08:25

по-моему гипотеза 2 совсем несостоятельная, хотя для тропиков может и не так. биобезобразие ведь выше на границах ландшафтных единиц или при каких-то нарушениях, там и сям растительность, как правило, более редкая
ин гроссен фамилен нихт клювен клац клац

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Вопрос по статистике в R

Сообщение Natalia Novoselova » 14 окт 2014, 08:29

nadiopt писал(а):по-моему гипотеза 2 совсем несостоятельная, хотя для тропиков может и не так. биобезобразие ведь выше на границах ландшафтных единиц или при каких-то нарушениях, там и сям растительность, как правило, более редкая

если гипотеза будет опровергнута - это тоже нормальный результат.\


Но у меня мысль, что виды экзоты вредят сильно тропическим экосистемам и,в потенциале, значительно его деградируют. То есть - это может отражаться на NDVI

Аватара пользователя
nadiopt
Гуру
Сообщения: 4744
Зарегистрирован: 29 янв 2009, 13:27
Репутация: 495
Ваше звание: хрюкало
Откуда: Санкт-Петербург
Контактная информация:

Re: Вопрос по статистике в R

Сообщение nadiopt » 14 окт 2014, 08:45

экзоты обычно такие развесистые и саблезубые... вон псевдоцуга всю Европу заполонила, а дерево какое огромное. Или борщевик
ин гроссен фамилен нихт клювен клац клац

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Вопрос по статистике в R

Сообщение Natalia Novoselova » 14 окт 2014, 15:19

nadiopt писал(а):экзоты обычно такие развесистые и саблезубые... вон псевдоцуга всю Европу заполонила, а дерево какое огромное. Или борщевик
Вы считаете что площадки нужны большего размера? Разумно. А сколько бы вы предложили?

Моя идея - делать серии площадок или размещать их в форме прямоугольника, но рядом, чтобы нивелировать человеческий фактор (наше желание включить в площадку определенные растения)

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Вопрос по статистике в R

Сообщение Natalia Novoselova » 14 окт 2014, 15:27

А вы не знаете, случайно, работы по негативному влиянию экзотических видов на тропические экосистемы?

Аватара пользователя
nadiopt
Гуру
Сообщения: 4744
Зарегистрирован: 29 янв 2009, 13:27
Репутация: 495
Ваше звание: хрюкало
Откуда: Санкт-Петербург
Контактная информация:

Re: Вопрос по статистике в R

Сообщение nadiopt » 14 окт 2014, 16:32

не знаю, Наташ, я не специалист по экологии, хотя и эколог по диплому
я имею ввиду, что продуктивность сообществ с экзотами за счет этих самых экзотов сильно повышается. Коренные виды они подавляют, разрастаются сами - и NDVI должно бы расти. Посмотрим, подтвердится ли ваша гипотеза.
ин гроссен фамилен нихт клювен клац клац

gamm
Гуру
Сообщения: 4168
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1107
Ваше звание: программист
Откуда: Казань

Re: Вопрос по статистике в R

Сообщение gamm » 14 окт 2014, 17:02

Natalia Novoselova писал(а):А вы не знаете, случайно, работы по негативному влиянию экзотических видов на тропические экосистемы?
то, что вы описываете, напоминает какой-то сюр ... у вас там что, ни одного биолога нет, чтобы хотя бы нормально сбор данных организовать и задачу поставить? все это к статистике отношения не имеет, пока нет нормального описания данных и постановки задачи.

Аватара пользователя
bzborisov
Участник
Сообщения: 58
Зарегистрирован: 06 фев 2014, 08:17
Репутация: 12

Re: Вопрос по статистике в R

Сообщение bzborisov » 14 окт 2014, 17:14

gamm писал(а):
Natalia Novoselova писал(а):А вы не знаете, случайно, работы по негативному влиянию экзотических видов на тропические экосистемы?
то, что вы описываете, напоминает какой-то сюр ... у вас там что, ни одного биолога нет, чтобы хотя бы нормально сбор данных организовать и задачу поставить? все это к статистике отношения не имеет, пока нет нормального описания данных и постановки задачи.
:mrgreen: :mrgreen: :mrgreen: :mrgreen: :mrgreen: :mrgreen: :mrgreen: :mrgreen: :mrgreen:
Согласен с Gamm, уважаемая Наталья вы бы сперва хотя бы Мэгарран почитали бы "Экологическое разнообразие и его измерение" там есть ссылки на (MacArthur, MacArthur, 1961; MacArthur et al., 1966; Karr, Roth, 1971; Recher, 1969; Moss, 1978) как раз по Вашей теме. Удачи :!: Но меня беспокоит Ваше многотемье, не реально много тем у Вас :D

Аватара пользователя
nadiopt
Гуру
Сообщения: 4744
Зарегистрирован: 29 янв 2009, 13:27
Репутация: 495
Ваше звание: хрюкало
Откуда: Санкт-Петербург
Контактная информация:

Re: Вопрос по статистике в R

Сообщение nadiopt » 14 окт 2014, 17:32

да тут надо не со статистики начинать, а с терминов и определений. Биоразнообразие ведь всеми видами оперирует, не только растениями, и оно, например, может быть очень высоким на каком-нибудь короеднике за счет насекомых, грибов и подлесочных видов. NDVI кстати при этом упадет.
я еще не могу понять, откуда известно, что на территории N есть экзоты, а на территории M их нет
ин гроссен фамилен нихт клювен клац клац

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Вопрос по статистике в R

Сообщение Natalia Novoselova » 14 окт 2014, 19:35

bzborisov писал(а): Но меня беспокоит Ваше многотемье, не реально много тем у Вас :D

Много?.. Хмм.. а я еще сюда со снимками Марса не пришла. Но приду, возможно. :D
А что, от ресурса международного значения, GIS-Lab приобретет статус ресурса межпланетного значения.. :)

без шуток кстати.
Последний раз редактировалось Natalia Novoselova 14 окт 2014, 19:42, всего редактировалось 2 раза.

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Вопрос по статистике в R

Сообщение Natalia Novoselova » 14 окт 2014, 19:38

gamm писал(а):
Natalia Novoselova писал(а):А вы не знаете, случайно, работы по негативному влиянию экзотических видов на тропические экосистемы?
то, что вы описываете, напоминает какой-то сюр ... у вас там что, ни одного биолога нет, чтобы хотя бы нормально сбор данных организовать и задачу поставить? все это к статистике отношения не имеет, пока нет нормального описания данных и постановки задачи.

Это студ. практика. В данном проекте задачу ставят студенты. Этот проект - целиком моей формулировки, но собрала команду из 4 человек. Проект короткий на 1 день.

Потом, правда, хочу по аналогии сделать в другом месте на том же курсе (сейчас вдали от океана в деградированном довольно Атлантическом лесу, а второй - около океана, там где лес хороший).


Пока решили площадки делать 10 на 10 м

Аватара пользователя
rhot
Гуру
Сообщения: 1727
Зарегистрирован: 25 янв 2011, 17:50
Репутация: 194
Ваше звание: доктор
Откуда: Архангельск

Re: Вопрос по статистике в R

Сообщение rhot » 14 окт 2014, 21:53

nadiopt права, всё зависит от определения. На мой взгляд, просто присутствие-отсутствие видов и размер диаметров не достаточно описывают биоразнообразие. Тут необходим комплексный подход (1), иначе термин биоразнообразие из формулироваки гипотезы следует исключить.

(1)
Noss, R. F. (1990). Indicators for Monitoring Biodiversity: A Hierarchical Approach. Conservation Biology 4(4), 355–364.
___________(¯`·.¸(¯`·.¸ Scientia potentia est _/ {SILVA}:::{FOSS}:::{GIS} \_ Знание сила ¸.·´¯)¸.·´¯)___________

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Вопрос по статистике в R

Сообщение Natalia Novoselova » 15 окт 2014, 00:58

rhot писал(а):nadiopt права, всё зависит от определения. На мой взгляд, просто присутствие-отсутствие видов и размер диаметров не достаточно описывают биоразнообразие. Тут необходим комплексный подход (1), иначе термин биоразнообразие из формулироваки гипотезы следует исключить..

Идея проекта в другом - через 4 указанных параметра проанализировать качество экосистемы (в данном случае оценить роль видов-экзотов на тропические экосистемы)

В целом это выступает частью идей будущего проекта (что-то вроде того, что прорабатываю идеи на практике, используя возможность - необходимость сделать какой-то небольшой проект)

За помощь в поиске литературы на эту тему - буду благодарна. ))

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Вопрос по статистике в R

Сообщение Natalia Novoselova » 16 окт 2014, 06:10

Данный пилотный проект проведен, результаты - оказались удивительно статистически-репрезентативными.
Все озвученные выше гипотезы - статистически подтвердились. Сравнивали 3 территории - с сосной (древесный вид-интродуцент), со злаком-интродуцентом и без видов интродуцентов, закладывали в каждом типе по 3 площадки 10 на 10 метров. Считали там число разных видов (не разделяя на экзоты и нативы, то есть общее разнообразие) и измеряли диаметры деревьев). Потом - NDVI, температура поверхности по Landsat-8, 2014.


Кроме индекса соотношения диаметров деревьев - это тоже подтвердилось, но только графиком (блок-сплотом, т.е. медианами). Забавно, что я этот индекс выдумала для наших целей и "от фонаря" назначила параметр (по которому разделять деревья), а потом люди стали говорить об этом значении и индексе как о чем-то широко им известном, причем с близкими параметрами, оказывается - давно введен и используется (ну это понятно - мысль движется одинаково для одних целей)

Ед. что плохо - я так и не продвинулась сильно в понимании статистики (делал другой участник команды). Хотя, вроде бы, начинаю (глядя на других) понимать ее лучше. Но где-то бы достать что-то простое и объясняющее эти приемы для экологии.... чтобы давалось задача - пример. Что-то пока не попадалось такого в книгах. Там так изложено, что вроде и пытаешься подступиться, а не получается. :(

Ответить

Вернуться в «Общие вопросы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 4 гостя