Сортировка текстовых данных

Вопросы по статистическому пакету R. Не обязательно гео.
Ответить
ymr3R9Jge
Активный участник
Сообщения: 117
Зарегистрирован: 31 окт 2011, 00:18
Репутация: 14
Откуда: Кривий Ріг

Сортировка текстовых данных

Сообщение ymr3R9Jge » 12 авг 2013, 15:41

Стоит следующая задача:
1. Имеем массив с текстовыми и числовыми столбцами (например - фамилия сотрудника и его оклад) - таблица №1;
2. Отдельно имеем таблицу с классификацией всех сотрудников по профессии (или должности) - таблица №2;
3. Нужно рассортировать сотрудников из таблицы №1 в соответствии с правилами таблицы №2;
4. По мере пополнения штата сотрудников - вписывать их в соответствующюю категорию в таблице №2 для последующего использования при сортировке;
5. При сортировке учитывать только полное совпадение в таблицах.
В принципе догадываюсь, что таблица №2 является обучающей выборкой, по которой производится сравнение для классификации того или иного элемента таблицы №1. Подскажите, пожалуйста, направление "копания" при работе с текстом в R.

gamm
Гуру
Сообщения: 4049
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1050
Ваше звание: программист
Откуда: Казань

Re: Сортировка текстовых данных

Сообщение gamm » 12 авг 2013, 17:04

ymr3R9Jge писал(а):Стоит следующая задача:
в R все сортировки, индексация, и т.д. выполняются с текстом

Код: Выделить всё

ind<-match(tab1$ID,tab2$ID)
print(tmp.newID<-unique(tab1$ID[is.na(ind)])) # показать не найденные коды
tab2<-rbind(tab2,data,frame(???,ID=c(tab2$ID,tmp.newID))
ind<-match(tab1$ID,tab2$ID)
tab1$IDfrom2<-tab2$ID[ind]
как-то так ... если нужен составной индекс, то делаем что-то типа
ind<-sptintf(%s-%d",tab$charVal,tab$intVal)

Ответить

Вернуться в «R»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 5 гостей