Не силён в номинальных данных, а нужно продемонстрировать возможности R при работе с таблицами сопряжённости. Дали следующие данные: таблица, в которой в строках обозначены различные горные породы, а в столбцах - породообразующие и акцессорные минералы. На перекрестии строк и столбцов стоят дихотомические данные - 0 или 1 (0 - минерал не встречается, 1 - минерал встречается). Кроме того, в последнем столбце указан тип породы (магматическая, метаморфическая и т.д.) Выглядит таблица приблизительно так (формат CSV):
poroda;kvarc;plagioklaz;biotit;tip
granit;1;1;0;magm
gabbro;0;1;0;magm
gneis;0;1;1;metamorf
Какие типы анализа и с помощью каких пакетов можно "придумать" к подобным таблицам?
PS возможности разных пакетов смотрел, но натыкался только на работу с таблицами, где учитываются частоты встречаемости номинальных признаков
Анализ таблиц сопряжённости
-
- Активный участник
- Сообщения: 117
- Зарегистрирован: 31 окт 2011, 00:18
- Репутация: 14
- Откуда: Кривий Ріг
-
- Гуру
- Сообщения: 4046
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1050
- Ваше звание: программист
- Откуда: Казань
Re: Анализ таблиц сопряжённости
вы не с того места начали. Нужно сформулировать решаемую проблему, потом статистическую модель, а потом (в рамках этой модели) проверить гипотезу и/или оценить параметры. Методов немеряно, в первую очередь разные варианты glm()ymr3R9Jge писал(а):возможности разных пакетов смотрел, но натыкался только на работу с таблицами, где учитываются частоты встречаемости номинальных признаков
-
- Активный участник
- Сообщения: 117
- Зарегистрирован: 31 окт 2011, 00:18
- Репутация: 14
- Откуда: Кривий Ріг
Re: Анализ таблиц сопряжённости
За подсказку насчёт GLM спасибо. По-поводу формулировки решаемой проблемы - попробую немного расширить рамки вопроса: а какими вообще методами можно обрабатывать подобные таблицы? (я понимаю, что вопрос немного не по теме форума, но меня интересует в конечном счёте обработка данных именно в R).gamm писал(а):Нужно сформулировать решаемую проблему, потом статистическую модель, а потом (в рамках этой модели) проверить гипотезу и/или оценить параметры. Методов немеряно, в первую очередь разные варианты glm()
-
- Гуру
- Сообщения: 4046
- Зарегистрирован: 15 окт 2010, 08:33
- Репутация: 1050
- Ваше звание: программист
- Откуда: Казань
Re: Анализ таблиц сопряжённости
еще раз сообщаю - вы не с того конца начинаете. Если вам нужна волшебная программа с волшебной кнопкой "Обработать таблицу", поставьте что-нибудь типа Statistica, там должно быть.ymr3R9Jge писал(а):По-поводу формулировки решаемой проблемы - попробую немного расширить рамки вопроса: а какими вообще методами можно обрабатывать подобные таблицы?
Методы используются для решения задачи, у вас решаемая задача не сформулирована. Методов для решения того, чего не сформулировано, не существует, ИМХО.
-
- Интересующийся
- Сообщения: 42
- Зарегистрирован: 02 ноя 2011, 09:11
- Репутация: 23
Re: Анализ таблиц сопряжённости
Посмотрите vcd package: http://cran.r-project.org/web/packages/vcd/index.html
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 4 гостя