Сортировка всего набора данных.

Вопросы по статистическому пакету R. Не обязательно гео.
Ответить
_taras_
Активный участник
Сообщения: 186
Зарегистрирован: 28 июл 2018, 08:40
Репутация: 12
Откуда: Киев

Сортировка всего набора данных.

Сообщение _taras_ » 14 авг 2021, 15:43

Приветствую всех!
Имеется таблица с десятком столбцов и надобно из них удалить значения меньше чем 0,2. Как это сделать в R?

gamm
Гуру
Сообщения: 4049
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1050
Ваше звание: программист
Откуда: Казань

Re: Сортировка всего набора данных.

Сообщение gamm » 14 авг 2021, 16:18

Что такое "удалить значения" и причем здесь сортировка? Попробуйте сформулировать задачу.
Можно удалить строки, столбцы, или заменить такие значения на NA, или еще чего-нибудь сделать. Все возможно

_taras_
Активный участник
Сообщения: 186
Зарегистрирован: 28 июл 2018, 08:40
Репутация: 12
Откуда: Киев

Re: Сортировка всего набора данных.

Сообщение _taras_ » 14 авг 2021, 16:44

Во всех столбцах надобно удалить значения меньше 0,2 и пропущенные значения.
Т.е. было
-0,2
NA
0.19
0.21
стало
0.21
И так в каждом столбце

Константин Силкин
Завсегдатай
Сообщения: 420
Зарегистрирован: 21 мар 2012, 07:37
Репутация: 67
Откуда: Воронеж

Re: Сортировка всего набора данных.

Сообщение Константин Силкин » 14 авг 2021, 16:55

Добрый день! Вы не поняли и вас не поняли. Если у вас был столбец с 5 значениями, 4 из которых не удовлетворяют условию, то вы, предположим, удалили 4 строки из 5. Пусть так. А что происходит при этом в других столбцах? Там значения в ячейках удалённых строк может условию как раз соответствовали? Но вы их удалили. Так тоже можно или это недоразумение?

_taras_
Активный участник
Сообщения: 186
Зарегистрирован: 28 июл 2018, 08:40
Репутация: 12
Откуда: Киев

Re: Сортировка всего набора данных.

Сообщение _taras_ » 14 авг 2021, 17:03

Константин Силкин писал(а):
14 авг 2021, 16:55
А что происходит при этом в других столбцах?
Т.е. строки столбцов связаны и удалять "ненужные" в столбцах по отдельности не получится? В моем случае столбцы самостоятельны и не связаны между собой.

Константин Силкин
Завсегдатай
Сообщения: 420
Зарегистрирован: 21 мар 2012, 07:37
Репутация: 67
Откуда: Воронеж

Re: Сортировка всего набора данных.

Сообщение Константин Силкин » 14 авг 2021, 17:08

Если у вас длина рядов данных в двумерном наборе данных может быть произвольной длины, то это просто никакая не таблица, а список списков. Решите для начала какая у вас будет структура данных. Из этого станет ясна и технология работы с ними

_taras_
Активный участник
Сообщения: 186
Зарегистрирован: 28 июл 2018, 08:40
Репутация: 12
Откуда: Киев

Re: Сортировка всего набора данных.

Сообщение _taras_ » 14 авг 2021, 17:18

Вот хорошее определение список списков.
Сейчас это то что нужно, без значений не отвечающих условию.
Для каждого столбца считается базовая статистика и достаточно. Просто это быстрее, чем делать одни и те же операции для каждого столбца.

gamm
Гуру
Сообщения: 4049
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1050
Ваше звание: программист
Откуда: Казань

Re: Сортировка всего набора данных.

Сообщение gamm » 14 авг 2021, 18:58

Для каждого столбца считается базовая статистика и достаточно. Просто это быстрее, чем делать одни и те же операции для каждого столбца.
попробуте еще раз, ничего понять нельзя ...

список списков и таблица - это две совершено разные вещи. И cтолбцов никаких в списке нет. Тогда уж список векторов.

из вектора удалить ненужные элементы просто
x=c(-0,2,NA,0.19,0.21)
x=x[!(is.na(x) | x<0.2)]
x

а если нужны только статистики, то кто мешает работать с таблицей, и считать только те элемены, которые нужны
x=c(-0,2,NA,0.19,0.21)
mean(x[!(is.na(x) | x<0.2)])

_taras_
Активный участник
Сообщения: 186
Зарегистрирован: 28 июл 2018, 08:40
Репутация: 12
Откуда: Киев

Re: Сортировка всего набора данных.

Сообщение _taras_ » 14 авг 2021, 19:54

Сделал в рукопашную
Попробую описать ещё раз.
Имеются несортированные данные по месяцам, которые сведены в одну таблицу. Месяц - отдельный столбец и нету связи между ними. Надобно удалить ненужные данные и сохранить результат.

Ivor
Завсегдатай
Сообщения: 345
Зарегистрирован: 11 дек 2006, 09:46
Репутация: 102
Откуда: Иркутск

Re: Сортировка всего набора данных.

Сообщение Ivor » 15 авг 2021, 04:11

_taras_, так вам и говорят, что вы изначально неверно выбрали метод. Таблица - это всегда зависимость между соседними столбцами. Это её суть и смысл.
То, что вы пытаетесь сделать - это подход Excel. Но Excel - абсолютное зло, он нарушает все понятия, правила и методы (хотя и в нём тоже есть истинные таблицы).
В вашем случае надобно обрабатывать каждый месяц как он есть - то бишь отдельно.

Ответить

Вернуться в «R»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 5 гостей