Вопрос по статистике в R
- Natalia Novoselova
- Гуру
- Сообщения: 3020
- Зарегистрирован: 15 янв 2013, 20:14
- Репутация: 69
- Ваше звание: Лиса
- Откуда: **
- Контактная информация:
Вопрос по статистике в R
Очень простой вопрос по статистике и R (для тех, кто разбирается и в том и в другом). Я совершенно не разбираюсь, но очень хочу хоть как-то этому научиться. Как всегда, учиться приходиться сразу на деле.
Есть 3 выборки:
A (территории с древесными видами-экзотами)
B (территории с травяными видами-экзотами)
С (территории без видов экзотов)
Каждая территория будет представлена (так мы планируем) площадками 5x5 метров в числе 10 на каждую выборку.
И для каждой такой площадки будут определяться параметры. Всего их будет четыре.
– два определяемых в поле: z1 число местных видов на площадке, z2 - коэф. толщины деревьев (сумма деревьев с d>50 cm / сумма деревьев с d<50 cm).
и два определяемых через Landsat8: z3 - NDVI, z4 - температура поверхности.
Задаю гипотезы, на которую ищу ответ.
Гипотеза 1. Точнее несколько однотипных, на каждый параметр z своя гипотеза)
В выборке А и B параметры z1, z2, z3 - меньше, чем в выборке C
Гипотеза2
При уменьшении биоразнообразия (т.е. числа разных видов на площадке) - NDVI этой площадки уменьшается
Какой статистический тест следует выбрать на 2 этих случая? Задача – определить статистически значимо, подтверждается гипотеза или нет.
Это нужно сделать в R (тут бы хорошо сказать чем там сразу это можно сделать. Я сразу изучу это и потренируюсь с кодом)
Всё это – есть проект, который нужно делать самостоятельно. То есть эти идеи - мои собственные (индекс толщины деревьев также, не знаю, есть ли что-то такое).
У меня проблема – сильный пробел (и неуверенность в себе) в вопросах статистики. Потому (хоть сама, конечно, тоже буду думать), задаю вопросом здесь, чтобы повысить шанс, узнать про это больше и лучше.
P.S. Понимаю, что у меня не хватает базовых знаний и не сформировано адекватное "статистическое " мышление. Но просто читать учебники - мне мало дает (там слишком сложно). Однако вижу вокруг, что люди берут простые тесты и быстро их используют (ну как инструменты) под каждый случай (задача экологии). Может это и простой уровень, по мне бы до такого дойти.
Есть 3 выборки:
A (территории с древесными видами-экзотами)
B (территории с травяными видами-экзотами)
С (территории без видов экзотов)
Каждая территория будет представлена (так мы планируем) площадками 5x5 метров в числе 10 на каждую выборку.
И для каждой такой площадки будут определяться параметры. Всего их будет четыре.
– два определяемых в поле: z1 число местных видов на площадке, z2 - коэф. толщины деревьев (сумма деревьев с d>50 cm / сумма деревьев с d<50 cm).
и два определяемых через Landsat8: z3 - NDVI, z4 - температура поверхности.
Задаю гипотезы, на которую ищу ответ.
Гипотеза 1. Точнее несколько однотипных, на каждый параметр z своя гипотеза)
В выборке А и B параметры z1, z2, z3 - меньше, чем в выборке C
Гипотеза2
При уменьшении биоразнообразия (т.е. числа разных видов на площадке) - NDVI этой площадки уменьшается
Какой статистический тест следует выбрать на 2 этих случая? Задача – определить статистически значимо, подтверждается гипотеза или нет.
Это нужно сделать в R (тут бы хорошо сказать чем там сразу это можно сделать. Я сразу изучу это и потренируюсь с кодом)
Всё это – есть проект, который нужно делать самостоятельно. То есть эти идеи - мои собственные (индекс толщины деревьев также, не знаю, есть ли что-то такое).
У меня проблема – сильный пробел (и неуверенность в себе) в вопросах статистики. Потому (хоть сама, конечно, тоже буду думать), задаю вопросом здесь, чтобы повысить шанс, узнать про это больше и лучше.
P.S. Понимаю, что у меня не хватает базовых знаний и не сформировано адекватное "статистическое " мышление. Но просто читать учебники - мне мало дает (там слишком сложно). Однако вижу вокруг, что люди берут простые тесты и быстро их используют (ну как инструменты) под каждый случай (задача экологии). Может это и простой уровень, по мне бы до такого дойти.
Последний раз редактировалось Natalia Novoselova 14 окт 2014, 08:27, всего редактировалось 1 раз.
- nadiopt
- Гуру
- Сообщения: 4744
- Зарегистрирован: 29 янв 2009, 13:27
- Репутация: 495
- Ваше звание: хрюкало
- Откуда: Санкт-Петербург
- Контактная информация:
Re: Вопрос по статистике в R
по-моему гипотеза 2 совсем несостоятельная, хотя для тропиков может и не так. биобезобразие ведь выше на границах ландшафтных единиц или при каких-то нарушениях, там и сям растительность, как правило, более редкая
ин гроссен фамилен нихт клювен клац клац
- Natalia Novoselova
- Гуру
- Сообщения: 3020
- Зарегистрирован: 15 янв 2013, 20:14
- Репутация: 69
- Ваше звание: Лиса
- Откуда: **
- Контактная информация:
Re: Вопрос по статистике в R
nadiopt писал(а):по-моему гипотеза 2 совсем несостоятельная, хотя для тропиков может и не так. биобезобразие ведь выше на границах ландшафтных единиц или при каких-то нарушениях, там и сям растительность, как правило, более редкая
если гипотеза будет опровергнута - это тоже нормальный результат.\
Но у меня мысль, что виды экзоты вредят сильно тропическим экосистемам и,в потенциале, значительно его деградируют. То есть - это может отражаться на NDVI
- nadiopt
- Гуру
- Сообщения: 4744
- Зарегистрирован: 29 янв 2009, 13:27
- Репутация: 495
- Ваше звание: хрюкало
- Откуда: Санкт-Петербург
- Контактная информация:
Re: Вопрос по статистике в R
экзоты обычно такие развесистые и саблезубые... вон псевдоцуга всю Европу заполонила, а дерево какое огромное. Или борщевик
ин гроссен фамилен нихт клювен клац клац
- Natalia Novoselova
- Гуру
- Сообщения: 3020
- Зарегистрирован: 15 янв 2013, 20:14
- Репутация: 69
- Ваше звание: Лиса
- Откуда: **
- Контактная информация:
Re: Вопрос по статистике в R
Вы считаете что площадки нужны большего размера? Разумно. А сколько бы вы предложили?nadiopt писал(а):экзоты обычно такие развесистые и саблезубые... вон псевдоцуга всю Европу заполонила, а дерево какое огромное. Или борщевик
Моя идея - делать серии площадок или размещать их в форме прямоугольника, но рядом, чтобы нивелировать человеческий фактор (наше желание включить в площадку определенные растения)
- Natalia Novoselova
- Гуру
- Сообщения: 3020
- Зарегистрирован: 15 янв 2013, 20:14
- Репутация: 69
- Ваше звание: Лиса
- Откуда: **
- Контактная информация:
Re: Вопрос по статистике в R
А вы не знаете, случайно, работы по негативному влиянию экзотических видов на тропические экосистемы?
- nadiopt
- Гуру
- Сообщения: 4744
- Зарегистрирован: 29 янв 2009, 13:27
- Репутация: 495
- Ваше звание: хрюкало
- Откуда: Санкт-Петербург
- Контактная информация:
Re: Вопрос по статистике в R
не знаю, Наташ, я не специалист по экологии, хотя и эколог по диплому
я имею ввиду, что продуктивность сообществ с экзотами за счет этих самых экзотов сильно повышается. Коренные виды они подавляют, разрастаются сами - и NDVI должно бы расти. Посмотрим, подтвердится ли ваша гипотеза.
я имею ввиду, что продуктивность сообществ с экзотами за счет этих самых экзотов сильно повышается. Коренные виды они подавляют, разрастаются сами - и NDVI должно бы расти. Посмотрим, подтвердится ли ваша гипотеза.
ин гроссен фамилен нихт клювен клац клац
-
- Гуру
- Сообщения: 4168
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1107
- Ваше звание: программист
- Откуда: Казань
Re: Вопрос по статистике в R
то, что вы описываете, напоминает какой-то сюр ... у вас там что, ни одного биолога нет, чтобы хотя бы нормально сбор данных организовать и задачу поставить? все это к статистике отношения не имеет, пока нет нормального описания данных и постановки задачи.Natalia Novoselova писал(а):А вы не знаете, случайно, работы по негативному влиянию экзотических видов на тропические экосистемы?
- bzborisov
- Участник
- Сообщения: 58
- Зарегистрирован: 06 фев 2014, 08:17
- Репутация: 12
Re: Вопрос по статистике в R
gamm писал(а):то, что вы описываете, напоминает какой-то сюр ... у вас там что, ни одного биолога нет, чтобы хотя бы нормально сбор данных организовать и задачу поставить? все это к статистике отношения не имеет, пока нет нормального описания данных и постановки задачи.Natalia Novoselova писал(а):А вы не знаете, случайно, работы по негативному влиянию экзотических видов на тропические экосистемы?









Согласен с Gamm, уважаемая Наталья вы бы сперва хотя бы Мэгарран почитали бы "Экологическое разнообразие и его измерение" там есть ссылки на (MacArthur, MacArthur, 1961; MacArthur et al., 1966; Karr, Roth, 1971; Recher, 1969; Moss, 1978) как раз по Вашей теме. Удачи


- nadiopt
- Гуру
- Сообщения: 4744
- Зарегистрирован: 29 янв 2009, 13:27
- Репутация: 495
- Ваше звание: хрюкало
- Откуда: Санкт-Петербург
- Контактная информация:
Re: Вопрос по статистике в R
да тут надо не со статистики начинать, а с терминов и определений. Биоразнообразие ведь всеми видами оперирует, не только растениями, и оно, например, может быть очень высоким на каком-нибудь короеднике за счет насекомых, грибов и подлесочных видов. NDVI кстати при этом упадет.
я еще не могу понять, откуда известно, что на территории N есть экзоты, а на территории M их нет
я еще не могу понять, откуда известно, что на территории N есть экзоты, а на территории M их нет
ин гроссен фамилен нихт клювен клац клац
- Natalia Novoselova
- Гуру
- Сообщения: 3020
- Зарегистрирован: 15 янв 2013, 20:14
- Репутация: 69
- Ваше звание: Лиса
- Откуда: **
- Контактная информация:
Re: Вопрос по статистике в R
bzborisov писал(а): Но меня беспокоит Ваше многотемье, не реально много тем у Вас
Много?.. Хмм.. а я еще сюда со снимками Марса не пришла. Но приду, возможно.

А что, от ресурса международного значения, GIS-Lab приобретет статус ресурса межпланетного значения..

без шуток кстати.
Последний раз редактировалось Natalia Novoselova 14 окт 2014, 19:42, всего редактировалось 2 раза.
- Natalia Novoselova
- Гуру
- Сообщения: 3020
- Зарегистрирован: 15 янв 2013, 20:14
- Репутация: 69
- Ваше звание: Лиса
- Откуда: **
- Контактная информация:
Re: Вопрос по статистике в R
gamm писал(а):то, что вы описываете, напоминает какой-то сюр ... у вас там что, ни одного биолога нет, чтобы хотя бы нормально сбор данных организовать и задачу поставить? все это к статистике отношения не имеет, пока нет нормального описания данных и постановки задачи.Natalia Novoselova писал(а):А вы не знаете, случайно, работы по негативному влиянию экзотических видов на тропические экосистемы?
Это студ. практика. В данном проекте задачу ставят студенты. Этот проект - целиком моей формулировки, но собрала команду из 4 человек. Проект короткий на 1 день.
Потом, правда, хочу по аналогии сделать в другом месте на том же курсе (сейчас вдали от океана в деградированном довольно Атлантическом лесу, а второй - около океана, там где лес хороший).
Пока решили площадки делать 10 на 10 м
- rhot
- Гуру
- Сообщения: 1727
- Зарегистрирован: 25 янв 2011, 17:50
- Репутация: 194
- Ваше звание: доктор
- Откуда: Архангельск
Re: Вопрос по статистике в R
nadiopt права, всё зависит от определения. На мой взгляд, просто присутствие-отсутствие видов и размер диаметров не достаточно описывают биоразнообразие. Тут необходим комплексный подход (1), иначе термин биоразнообразие из формулироваки гипотезы следует исключить.
(1)
Noss, R. F. (1990). Indicators for Monitoring Biodiversity: A Hierarchical Approach. Conservation Biology 4(4), 355–364.
(1)
Noss, R. F. (1990). Indicators for Monitoring Biodiversity: A Hierarchical Approach. Conservation Biology 4(4), 355–364.
___________(¯`·.¸(¯`·.¸ Scientia potentia est _/ {SILVA}:::{FOSS}:::{GIS} \_ Знание сила ¸.·´¯)¸.·´¯)___________
- Natalia Novoselova
- Гуру
- Сообщения: 3020
- Зарегистрирован: 15 янв 2013, 20:14
- Репутация: 69
- Ваше звание: Лиса
- Откуда: **
- Контактная информация:
Re: Вопрос по статистике в R
rhot писал(а):nadiopt права, всё зависит от определения. На мой взгляд, просто присутствие-отсутствие видов и размер диаметров не достаточно описывают биоразнообразие. Тут необходим комплексный подход (1), иначе термин биоразнообразие из формулироваки гипотезы следует исключить..
Идея проекта в другом - через 4 указанных параметра проанализировать качество экосистемы (в данном случае оценить роль видов-экзотов на тропические экосистемы)
В целом это выступает частью идей будущего проекта (что-то вроде того, что прорабатываю идеи на практике, используя возможность - необходимость сделать какой-то небольшой проект)
За помощь в поиске литературы на эту тему - буду благодарна. ))
- Natalia Novoselova
- Гуру
- Сообщения: 3020
- Зарегистрирован: 15 янв 2013, 20:14
- Репутация: 69
- Ваше звание: Лиса
- Откуда: **
- Контактная информация:
Re: Вопрос по статистике в R
Данный пилотный проект проведен, результаты - оказались удивительно статистически-репрезентативными.
Все озвученные выше гипотезы - статистически подтвердились. Сравнивали 3 территории - с сосной (древесный вид-интродуцент), со злаком-интродуцентом и без видов интродуцентов, закладывали в каждом типе по 3 площадки 10 на 10 метров. Считали там число разных видов (не разделяя на экзоты и нативы, то есть общее разнообразие) и измеряли диаметры деревьев). Потом - NDVI, температура поверхности по Landsat-8, 2014.
Кроме индекса соотношения диаметров деревьев - это тоже подтвердилось, но только графиком (блок-сплотом, т.е. медианами). Забавно, что я этот индекс выдумала для наших целей и "от фонаря" назначила параметр (по которому разделять деревья), а потом люди стали говорить об этом значении и индексе как о чем-то широко им известном, причем с близкими параметрами, оказывается - давно введен и используется (ну это понятно - мысль движется одинаково для одних целей)
Ед. что плохо - я так и не продвинулась сильно в понимании статистики (делал другой участник команды). Хотя, вроде бы, начинаю (глядя на других) понимать ее лучше. Но где-то бы достать что-то простое и объясняющее эти приемы для экологии.... чтобы давалось задача - пример. Что-то пока не попадалось такого в книгах. Там так изложено, что вроде и пытаешься подступиться, а не получается.
Все озвученные выше гипотезы - статистически подтвердились. Сравнивали 3 территории - с сосной (древесный вид-интродуцент), со злаком-интродуцентом и без видов интродуцентов, закладывали в каждом типе по 3 площадки 10 на 10 метров. Считали там число разных видов (не разделяя на экзоты и нативы, то есть общее разнообразие) и измеряли диаметры деревьев). Потом - NDVI, температура поверхности по Landsat-8, 2014.
Кроме индекса соотношения диаметров деревьев - это тоже подтвердилось, но только графиком (блок-сплотом, т.е. медианами). Забавно, что я этот индекс выдумала для наших целей и "от фонаря" назначила параметр (по которому разделять деревья), а потом люди стали говорить об этом значении и индексе как о чем-то широко им известном, причем с близкими параметрами, оказывается - давно введен и используется (ну это понятно - мысль движется одинаково для одних целей)
Ед. что плохо - я так и не продвинулась сильно в понимании статистики (делал другой участник команды). Хотя, вроде бы, начинаю (глядя на других) понимать ее лучше. Но где-то бы достать что-то простое и объясняющее эти приемы для экологии.... чтобы давалось задача - пример. Что-то пока не попадалось такого в книгах. Там так изложено, что вроде и пытаешься подступиться, а не получается.

Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя