Кластерный анализ водных масс. DataMining модули
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Кластерный анализ водных масс. DataMining модули
Здравствуйте. Требуется кластерным анализом проанализировать-классифицировать водные массы арктических морей по температуре, солености, кислороду, кремнию... Кто имеет опыт с решением такой задачи в пакете R, в Python-библиотеках или в каких-нибудь др. DataMinig-модулях? Чем порекомендуете воспользоваться?
-
- Гуру
- Сообщения: 4170
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1107
- Ваше звание: программист
- Откуда: Казань
Re: Кластерный анализ водных масс. DataMining модули
для статистического лучше не использовать ничего, кроме R (все остальное - "костыли"), а DataMinig тут вообще ни причем.nickleb писал(а):Здравствуйте. Требуется кластерным анализом проанализировать-классифицировать водные массы арктических морей по температуре, солености, кислороду, кремнию... Кто имеет опыт с решением такой задачи в пакете R, в Python-библиотеках или в каких-нибудь др. DataMinig-модулях? Чем порекомендуете воспользоваться?
если p - таблица с данными, то для начала пойдет следующий код
Код: Выделить всё
#=====================================================================================
# --- data sample
#=====================================================================================
p=data.frame(X1=rnorm(100),X2=rnorm(100),X3=rnorm(100),X4=rnorm(100),RowName=1:100)
#=====================================================================================
# --- Cluster
#=====================================================================================
p.names<-c("X1", "X2", "X3", "X4") # имена переменных
t<-scale(p[,p.names]) # масштабируем, чтобы влияние было примерно одинаковым.
# По уму требуется анализ гистограммы и преобразование к более-менее симметричному виду,
# для концентраций обычно логарифмирование, и т.д.
row.names(t)<-p$RowName # имена строк, можно 1:nrow(p)
p.dist<-dist(t)
p.clust<-hclust(p.dist,method="ward.D")
plot(p.clust,main="Кластерный анализ",cex=0.75,lwd=2)
#=====================================================================================
# --- PCA ----------------------------------------------------------------------------
#=====================================================================================
library(vegan)
x.names<-c("X1", "X2", "X3", "X4") # имена переменных
p.PCA<-rda(X=p[,x.names],scale=TRUE)
cur.scaling<-1
p.PCA.xy<-p.PCA$CA$u[,c("PC1","PC2")]
plot(p.PCA.xy,main="PCA",pch=20,cex=1.5)
text(p.PCA.xy,as.character(p$RowName),pos=4,cex=0.5)
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Кластерный анализ водных масс. DataMining модули
спасибо, gamm... 2.15 или 3-ку уже ставить? что лучше с прицелом на "картирование", из R не выходя?
-
- Гуру
- Сообщения: 4170
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1107
- Ваше звание: программист
- Откуда: Казань
Re: Кластерный анализ водных масс. DataMining модули
зависит от глубины анализа, для упомянутых методов и 1.8.2 хватитnickleb писал(а):спасибо, gamm... 2.15 или 3-ку уже ставить?
смотря что имеется в виду. Если собственно анализ и подготовка данных, то все зависит от качества и количества данных, средства есть начиная с простых интерполяторов и регрессий, до пространственно-временных случайных полей с использованием R-INLA. А чтобы картинки раскрашивать, есть пакеты lattice, rgdal, maptools, shapfiles, sp (перечислено то, чем я карты отчетные рисовал в последний раз; есть и другие). А можно вывалить результат в файлы, и раскрашивать в любой ГИС - системе.что лучше с прицелом на "картирование", из R не выходя?
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Кластерный анализ водных масс. DataMining модули
благодарю, gamm... ещё у Вас буду консультироваться по ходу дел...
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Кластерный анализ водных масс. DataMining модули
Уважаемый gamm, установил R-INLA... С какого tutorial'а порекомендуете начать?nickleb писал(а):...до пространственно-временных случайных полей с использованием R-INLA...
-
- Гуру
- Сообщения: 4170
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1107
- Ваше звание: программист
- Откуда: Казань
Re: Кластерный анализ водных масс. DataMining модули
первые три на http://www.r-inla.org/examples/tutorials, скачать коды и выбрать что-то по вкусу. Но нужно понимать, что тут нет тьюторилов, которые описывают последовательность нажатия кнопок. Да и кнопок нет. И уж больно заковыристый у них способ задания модели (при отсутствии детального описания не только семантики, но и синтаксиса, может потребоваться некоторое время, чтобы что-то понять) ...nickleb писал(а):Уважаемый gamm, установил R-INLA... С какого tutorial'а порекомендуете начать?
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Кластерный анализ водных масс. DataMining модули
приветствую Вас, gamm!.. спасибо... понимаю, что не всё так просто... помалёху будем разбираться и вкушать...
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Кластерный анализ водных масс. DataMining модули
gamm, я отработал с примером Вашего кода, приведённом в этом post'е... - огромное спасибо - всё отработало! а как мне получить в ASCII-файле дендрограмму кластерного анализа? да и график главных компонент?
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Кластерный анализ водных масс. DataMining модули
... график главных компонент - также в цифре вывести?
-
- Гуру
- Сообщения: 4170
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1107
- Ваше звание: программист
- Откуда: Казань
Re: Кластерный анализ водных масс. DataMining модули
я руками все обычно делал, внутри классов все лежит, что нужно. Но есть и какие-то готовые методы/функции, насколько я помню. Дендрограмму лучше нарисовать - я плохо представляю, как ее в текст вывести, а если классы нужно присвоить - там функция есть cutree(), задаете число классов. Главные компоненты тоже в классе лежат (в виде матрицы), а в пакете vegan разные рисовалки есть.nickleb писал(а):gamm, я отработал с примером Вашего кода, приведённом в этом post'е... - огромное спасибо - всё отработало! а как мне получить в ASCII-файле дендрограмму кластерного анализа? да и график главных компонент?
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Кластерный анализ водных масс. DataMining модули
спасибо. завтра буду разбираться. конечно, мощный и интуитивно понятный этот проект R... жаль, что раньше не пользовался... там ведь ещё и R-NCEP есть... хорошо, что меня просветили и дали рабочий пример!gamm писал(а):[quote="nickleb"... там функция есть cutree(), задаете число классов. Главные компоненты тоже в классе лежат (в виде матрицы)....
-
- Гуру
- Сообщения: 969
- Зарегистрирован: 22 май 2010, 20:20
- Репутация: 154
Re: Кластерный анализ водных масс. DataMining модули
Cut a hierarchical cluster tree and write cluster identifiers to a text file.
http://rgm3.lab.nig.ac.jp/RGM/R_rdfile? ... .Rd&d=R_CC
http://rgm3.lab.nig.ac.jp/RGM/R_rdfile? ... .Rd&d=R_CC
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя