Анализ таблиц сопряжённости

Вопросы по статистическому пакету R. Не обязательно гео.
Ответить
ymr3R9Jge
Активный участник
Сообщения: 117
Зарегистрирован: 31 окт 2011, 00:18
Репутация: 14
Откуда: Кривий Ріг

Анализ таблиц сопряжённости

Сообщение ymr3R9Jge » 14 янв 2013, 01:20

Не силён в номинальных данных, а нужно продемонстрировать возможности R при работе с таблицами сопряжённости. Дали следующие данные: таблица, в которой в строках обозначены различные горные породы, а в столбцах - породообразующие и акцессорные минералы. На перекрестии строк и столбцов стоят дихотомические данные - 0 или 1 (0 - минерал не встречается, 1 - минерал встречается). Кроме того, в последнем столбце указан тип породы (магматическая, метаморфическая и т.д.) Выглядит таблица приблизительно так (формат CSV):

poroda;kvarc;plagioklaz;biotit;tip
granit;1;1;0;magm
gabbro;0;1;0;magm
gneis;0;1;1;metamorf


Какие типы анализа и с помощью каких пакетов можно "придумать" к подобным таблицам?
PS возможности разных пакетов смотрел, но натыкался только на работу с таблицами, где учитываются частоты встречаемости номинальных признаков

gamm
Гуру
Сообщения: 4046
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1050
Ваше звание: программист
Откуда: Казань

Re: Анализ таблиц сопряжённости

Сообщение gamm » 14 янв 2013, 04:32

ymr3R9Jge писал(а):возможности разных пакетов смотрел, но натыкался только на работу с таблицами, где учитываются частоты встречаемости номинальных признаков
вы не с того места начали. Нужно сформулировать решаемую проблему, потом статистическую модель, а потом (в рамках этой модели) проверить гипотезу и/или оценить параметры. Методов немеряно, в первую очередь разные варианты glm()

ymr3R9Jge
Активный участник
Сообщения: 117
Зарегистрирован: 31 окт 2011, 00:18
Репутация: 14
Откуда: Кривий Ріг

Re: Анализ таблиц сопряжённости

Сообщение ymr3R9Jge » 14 янв 2013, 23:19

gamm писал(а):Нужно сформулировать решаемую проблему, потом статистическую модель, а потом (в рамках этой модели) проверить гипотезу и/или оценить параметры. Методов немеряно, в первую очередь разные варианты glm()
За подсказку насчёт GLM спасибо. По-поводу формулировки решаемой проблемы - попробую немного расширить рамки вопроса: а какими вообще методами можно обрабатывать подобные таблицы? (я понимаю, что вопрос немного не по теме форума, но меня интересует в конечном счёте обработка данных именно в R).

gamm
Гуру
Сообщения: 4046
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1050
Ваше звание: программист
Откуда: Казань

Re: Анализ таблиц сопряжённости

Сообщение gamm » 15 янв 2013, 06:11

ymr3R9Jge писал(а):По-поводу формулировки решаемой проблемы - попробую немного расширить рамки вопроса: а какими вообще методами можно обрабатывать подобные таблицы?
еще раз сообщаю - вы не с того конца начинаете. Если вам нужна волшебная программа с волшебной кнопкой "Обработать таблицу", поставьте что-нибудь типа Statistica, там должно быть.

Методы используются для решения задачи, у вас решаемая задача не сформулирована. Методов для решения того, чего не сформулировано, не существует, ИМХО.

MYS
Интересующийся
Сообщения: 42
Зарегистрирован: 02 ноя 2011, 09:11
Репутация: 23

Re: Анализ таблиц сопряжённости

Сообщение MYS » 18 янв 2013, 18:32


Ответить

Вернуться в «R»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 4 гостя