Кириллица читается из базы некорректно

Вопросы по статистическому пакету R. Не обязательно гео.
Аватара пользователя
VistaSV30
Активный участник
Сообщения: 185
Зарегистрирован: 02 июл 2018, 15:05
Репутация: 7
Откуда: Балашиха

Re: Кириллица читается из базы некорректно

Сообщение VistaSV30 » 25 июн 2020, 08:34

Спасибо друзья-коллеги!
Снова Вы меня выручили!
Всё работает как надо! :D
Природа не просто эксцентричнее, чем мы полагаем - она эксцентричнее, чем мы способны предположить. John Haldane

gamm
Гуру
Сообщения: 4068
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1062
Ваше звание: программист
Откуда: Казань

Re: Кириллица читается из базы некорректно

Сообщение gamm » 25 июн 2020, 08:37

сил нет смотреть на мазохистов ...

Код: Выделить всё

> library(foreign)
> 
> p = read.dbf("d:/temp/f111.dbf",as.is=TRUE)
> Encoding(p$TEXT)
[1] "unknown" "unknown"
> head(p)
  KOD                      TEXT
1   0 Ќ…Ќ…–Љ€‰ Ђ‚’ЋЌЋЊЌ›‰ ЋЉђ“ѓ
2   1 ЌҐ­ҐжЄЁ©  ўв®­®¬­л© ®ЄагЈ
> 
> iconv.list=iconvlist()
> 
> pos=grep("866",iconv.list)
> iconv.list[pos]
[1] "866"      "cp866"    "CP866"    "CSIBM866" "IBM866"  
> 
> pos=grep("1251",iconv.list)
> iconv.list[pos]
[1] "CP1251"       "windows-1251"
> 
> p$TEXT2 = iconv(p$TEXT, from = "CP866", to = "CP1251", sub = "?")
> print(p)
  KOD                      TEXT                     TEXT2
1   0 Ќ…Ќ…–Љ€‰ Ђ‚’ЋЌЋЊЌ›‰ ЋЉђ“ѓ НЕНЕЦКИЙ АВТОНОМНЫЙ ОКРУГ
2   1 ЌҐ­ҐжЄЁ©  ўв®­®¬­л© ®ЄагЈ Ненецкий автономный округ

nickleb
Гуру
Сообщения: 964
Зарегистрирован: 22 май 2010, 20:20
Репутация: 154

Re: Кириллица читается из базы некорректно

Сообщение nickleb » 25 июн 2020, 09:12

gamm писал(а):
25 июн 2020, 08:37
iconv
ну, конечно, - это в корень !
вспоминал же выше Ваш ответ пятилетней давности...

Ответить

Вернуться в «R»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя