Код в R для ks-test (Kolmogorov-Smirnov test двух выборок)

Вопросы по статистическому пакету R. Не обязательно гео.
Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Код в R для ks-test (Kolmogorov-Smirnov test двух выборок)

Сообщение Natalia Novoselova » 15 июн 2013, 15:21

Не могли бы посоветовать, какой пакет можно использовать для этой цели?

Я совсем новичок в R, данный анализ нужно провести именно в R (как и учебное задание, и шаг по проекту). Поэтому хотелось бы на этом примере вообще научиться - искать здесь нужное, понимать, как это использовать. Может быть есть какая-то литературная помощь по данному вопросу?
Последний раз редактировалось Natalia Novoselova 22 июн 2013, 14:41, всего редактировалось 2 раза.

Иван Стрельников
Интересующийся
Сообщения: 40
Зарегистрирован: 11 авг 2011, 13:23
Репутация: 15

Re: Пакет R для Kolmogorov-Smirnov test для двух выборок

Сообщение Иван Стрельников » 16 июн 2013, 00:26

А функция ks.test() из базового набора Вам не подходит? Она вроде с двумя векторами работает без проблем.

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Пакет R для Kolmogorov-Smirnov test для двух выборок

Сообщение Natalia Novoselova » 16 июн 2013, 02:47

Вот здесь Available CRAN Packages By Date of Publication ищу по слову "kolmogorov" и нашла то, что вроде по описанию может подходить
kolmin

Но хоть там и есть краткий Reference, той информации мне не хватило пока, чтобы понять, как это делать. :(


Иван Стрельников писал(а):А функция ks.test() из базового набора Вам не подходит? Она вроде с двумя векторами работает без проблем.
А где это найти? Может быть там больше будет сказано, как это делать..

в общем, как говорила, я с этого начинаю. Мне бы подсказки - с чего вообще начать, чтобы провести данный анализ. Это позволило бы мне и дальше пойти. В том смысле - что читать, или же где искать конкретные примеры кода по данной опции (я полагаю, это должно быть, в виде примеров, иллюстрирующих практикум). Осложняется тем, что задача у меня очень узкая..

Иван Стрельников
Интересующийся
Сообщения: 40
Зарегистрирован: 11 авг 2011, 13:23
Репутация: 15

Re: Пакет R для Kolmogorov-Smirnov test для двух выборок

Сообщение Иван Стрельников » 16 июн 2013, 15:44

Задайте вопрос более конкретно.
ks.test это пакет stats, т.е. обычно установлен изначально. Для информации по функции просто введите в R вопросительный знак и название функции. Там же будет и элементарный пример выполнения этой функции. Но это я так -- притворяюсь кепом.

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Пакет R для Kolmogorov-Smirnov test для двух выборок

Сообщение Natalia Novoselova » 16 июн 2013, 16:14

Иван Стрельников писал(а):Задайте вопрос более конкретно.
ks.test это пакет stats, т.е. обычно установлен изначально. Для информации по функции просто введите в R вопросительный знак и название функции. Там же будет и элементарный пример выполнения этой функции. Но это я так -- притворяюсь кепом.
Хелп по функциям нашла, спасибо, буду разбираться.

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Пакет R для Kolmogorov-Smirnov test для двух выборок

Сообщение Natalia Novoselova » 17 июн 2013, 04:12

Да, в хелпе по ks-test сказано намного больше, и даже есть пример. Вероятно, в нем будет просто разобраться тому, кто уже работает с языком, там не должно быть ничего сложного.

Может быть меня кто-то научит это понимать?

Вот, пример моих данных (цифры пока выдуманы, но их число и порядок будут эти)

sept (X) 300, 110, 48, 240, 110, 50, 250, 78, 45, 60, 90, 200
dec (Y) 320, 80, 150, 120, 90, 45, 25, 90, 60, 250, 120, 30

И вот хелп по ks-test: http://astrostatistics.psu.edu/su07/R/h ... .test.html

Как я понимаю, X и Y я обозначила правильно - это две выборки, характер распределения которых предполагается сравнить.

И пример из хелпа:
Examples

require(graphics)

x <- rnorm(50)
y <- runif(30)
# Do x and y come from the same distribution?
ks.test(x, y)
# Does x come from a shifted gamma distribution with shape 3 and rate 2?
ks.test(x+2, "pgamma", 3, 2) # two-sided, exact
ks.test(x+2, "pgamma", 3, 2, exact = FALSE)
ks.test(x+2, "pgamma", 3, 2, alternative = "gr")

# test if x is stochastically larger than x2
x2 <- rnorm(50, -1)
plot(ecdf(x), xlim = range(c(x, x2)))
plot(ecdf(x2), add = TRUE, lty = "dashed")
t.test(x, x2, alternative = "g")
wilcox.test(x, x2, alternative = "g")
ks.test(x, x2, alternative = "l")
Предполагаю, что мои данные (X и Y) нужно или вписать строчкой, или загрузить в программу в виде txt таблицы.
Но как это делать в данном примере?

Иван Стрельников
Интересующийся
Сообщения: 40
Зарегистрирован: 11 авг 2011, 13:23
Репутация: 15

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение Иван Стрельников » 18 июн 2013, 00:18

Если отвечать в лоб, то это должно выглядеть так:

Код: Выделить всё

sept<-c(300,110,48,240,110,50,250,78,45,60,90,200)
dec<-c(320,80,150,120,90,45,25,90,60,250,120,30)
ks.test(sept,dec)
Но это, собственно, мало поможет в дальнейшем. Все же советую начать с чтения справочной информации по R.
По Вашим вопросам можно предложить следующее.
Для начала просто разберитесь в том, какие существуют типы данных например здесь Basic Data Types.
Далее методы импорта данных: Data import
Вообще для начала неплохо последовательно пройти базовый мануал: An Introduction to R. Он достаточно лаконичный. Просто вчитайтесь, выполняйте примеры, потом сами не заметите, как начнете ориентироваться в том, что делаете.

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение Natalia Novoselova » 18 июн 2013, 00:43

Иван Стрельников писал(а):Если отвечать в лоб, то это должно выглядеть так:

Код: Выделить всё

sept<-c(300,110,48,240,110,50,250,78,45,60,90,200)
dec<-c(320,80,150,120,90,45,25,90,60,250,120,30)
ks.test(sept,dec)
Но это, собственно, мало поможет в дальнейшем.
Спасибо за ссылки! Я как раз это и начала делать (и вот, как раз, уже поняла то, что вы мне показали в примере ))
Ваши будут мне весьма в помощь

Но изучая основы - я сразу думаю, как это приложить для данной задачи. Понимаю то есть, что мне нужно понять - теорию самого KS анализа - как он осуществляется в R. То есть в чем проблема - я читаю теорию про него в Zar, в wiki, в еще каких то учебниках - смотрю на пример в хелпе к ks-teste и не понимаю что там вообще к чему.

наверное, когда я разберусь в каждой команде этого примера - станет яснее, не знаю..

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение Natalia Novoselova » 18 июн 2013, 00:47

Собственно, я загрузила этот ряд данных и по этому примеру все провела через программу, что-то получилось.. и даже с графиком :) но явно что нет никаких гарантий, что я сделала правильно, точнее есть гарантия противоположному.


А вы не знаете, есть ли какие-то форумы (вероятно, англо-языч) или сообщества пользователей, где также можно попробовать по задавать вопросы новичкам, если так сама не разберусь?

bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение bolotoved » 18 июн 2013, 05:05

Natalia писал(а):А вы не знаете, есть ли какие-то форумы (вероятно, англо-языч) или сообщества пользователей, где также можно попробовать по задавать вопросы новичкам, если так сама не разберусь?
Мне больше всего помогает http://stackoverflow.com/questions/tagged/r
На большую часть моих вопросов там уже были ответы.

Аватара пользователя
Игорь Черниенко
Активный участник
Сообщения: 137
Зарегистрирован: 28 мар 2009, 01:05
Репутация: 11
Откуда: Хабаровск, Южно-Сахалинск

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение Игорь Черниенко » 18 июн 2013, 05:30

http://molbiol.ru/forums/index.php?show ... 724&st=950

Если я не ошибаюсь, ветку форума модерирует сам А. Шипунов

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение Natalia Novoselova » 18 июн 2013, 06:06

bolotoved писал(а):На большую часть моих вопросов там уже были ответы.
Спасибо! А как там оптимальнее всего искать, чтобы просматривать ответы ближе к своему вопросу? Только по тегу "R" и смотреть все подряд, или можно более детально задавать поиск?

А вообще интересно протестировать ресурс, как то с таким типом еще не сталкивалась.

Аватара пользователя
Natalia Novoselova
Гуру
Сообщения: 3020
Зарегистрирован: 15 янв 2013, 20:14
Репутация: 69
Ваше звание: Лиса
Откуда: **
Контактная информация:

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение Natalia Novoselova » 18 июн 2013, 06:09

Игорь Черниенко писал(а):http://molbiol.ru/forums/index.php?show ... 724&st=950

Если я не ошибаюсь, ветку форума модерирует сам А. Шипунов
Спасибо! Боюсь, мне это имя ничего не говорит.. :)
Сам ресурс очень интересный, но кажется довольно сложным в конструкции, не смогла пока найти где находиться этот раздел (по R) в общей структуре форумов, видимо, какая-то маленькая подветка, исходя из специфики форума.

bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение bolotoved » 18 июн 2013, 07:27

Natalia писал(а):Спасибо! А как там оптимальнее всего искать, чтобы просматривать ответы ближе к своему вопросу? Только по тегу "R" и смотреть все подряд, или можно более детально задавать поиск?
Я обычно пользуюсь Гуглом, задавая запрос таким образом:

Код: Выделить всё

r-project ключевые слова
Проект R имеет крайне неудачное название, отчасти, ситуацию исправляет замена R на R-Project или CRAN. Например, в вашем случае, запрос в гугле я бы задал так:

Код: Выделить всё

r-project Kolmogorov Smirnov
И отдал бы предпочтение ссылкам ведущим на stackoverflow.com котрые обязательно есть в топе, хотя и просмотрел бы ссылки и на другие ресурсы. Если же искать исключительно по stackoverflow.com, то можно модифицировать гугло-поиск следующим образом:

Код: Выделить всё

r Kolmogorov Smirnov site:http://stackoverflow.com
Но сам по себе stackoverflow ценен тем, что там можно именно задать вопрос и почти наверняка получишь дельный ответ (т.к. просматривают форум огромное количество спецов со всего мира), если такой вопрос уже был, дадут ссылку на топик, где ваша проблема уже решена.

bolotoved
Гуру
Сообщения: 920
Зарегистрирован: 30 дек 2008, 14:11
Репутация: 236
Откуда: Ханты-Мансийск
Контактная информация:

Re: Код в R для ks-test (Kolmogorov-Smirnov test двух выборо

Сообщение bolotoved » 18 июн 2013, 07:35

Natalia писал(а):
Игорь Черниенко писал(а):http://molbiol.ru/forums/index.php?show ... 724&st=950

Если я не ошибаюсь, ветку форума модерирует сам А. Шипунов
Спасибо! Боюсь, мне это имя ничего не говорит.. :)
Алексей Шипунов - весьма известная среди российских биологов и экологов фигура благодаря:
1) своей электронной библиотеке, цель которой донести до широкого круга достояние российской научной культуры биологической мысли -- книги по теории и практике по биологии и смежным наукам:
http://ashipunov.info/shipunov/school/sch-ru.htm
2) деятельности на поприще популяризации языка R в русскоязычной среде этих же биологов:
http://ashipunov.info/shipunov/software/r/r-ru.htm
3) множества других заслуг в науке и образовании (особо следует отметить школьное, потому как это у нас сейчас очень слабое звено).

Ответить

Вернуться в «R»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя