Страница 1 из 1

Сортировка всего набора данных.

Добавлено: 14 авг 2021, 15:43
_taras_
Приветствую всех!
Имеется таблица с десятком столбцов и надобно из них удалить значения меньше чем 0,2. Как это сделать в R?

Re: Сортировка всего набора данных.

Добавлено: 14 авг 2021, 16:18
gamm
Что такое "удалить значения" и причем здесь сортировка? Попробуйте сформулировать задачу.
Можно удалить строки, столбцы, или заменить такие значения на NA, или еще чего-нибудь сделать. Все возможно

Re: Сортировка всего набора данных.

Добавлено: 14 авг 2021, 16:44
_taras_
Во всех столбцах надобно удалить значения меньше 0,2 и пропущенные значения.
Т.е. было
-0,2
NA
0.19
0.21
стало
0.21
И так в каждом столбце

Re: Сортировка всего набора данных.

Добавлено: 14 авг 2021, 16:55
Константин Силкин
Добрый день! Вы не поняли и вас не поняли. Если у вас был столбец с 5 значениями, 4 из которых не удовлетворяют условию, то вы, предположим, удалили 4 строки из 5. Пусть так. А что происходит при этом в других столбцах? Там значения в ячейках удалённых строк может условию как раз соответствовали? Но вы их удалили. Так тоже можно или это недоразумение?

Re: Сортировка всего набора данных.

Добавлено: 14 авг 2021, 17:03
_taras_
Константин Силкин писал(а):
14 авг 2021, 16:55
А что происходит при этом в других столбцах?
Т.е. строки столбцов связаны и удалять "ненужные" в столбцах по отдельности не получится? В моем случае столбцы самостоятельны и не связаны между собой.

Re: Сортировка всего набора данных.

Добавлено: 14 авг 2021, 17:08
Константин Силкин
Если у вас длина рядов данных в двумерном наборе данных может быть произвольной длины, то это просто никакая не таблица, а список списков. Решите для начала какая у вас будет структура данных. Из этого станет ясна и технология работы с ними

Re: Сортировка всего набора данных.

Добавлено: 14 авг 2021, 17:18
_taras_
Вот хорошее определение список списков.
Сейчас это то что нужно, без значений не отвечающих условию.
Для каждого столбца считается базовая статистика и достаточно. Просто это быстрее, чем делать одни и те же операции для каждого столбца.

Re: Сортировка всего набора данных.

Добавлено: 14 авг 2021, 18:58
gamm
Для каждого столбца считается базовая статистика и достаточно. Просто это быстрее, чем делать одни и те же операции для каждого столбца.
попробуте еще раз, ничего понять нельзя ...

список списков и таблица - это две совершено разные вещи. И cтолбцов никаких в списке нет. Тогда уж список векторов.

из вектора удалить ненужные элементы просто
x=c(-0,2,NA,0.19,0.21)
x=x[!(is.na(x) | x<0.2)]
x

а если нужны только статистики, то кто мешает работать с таблицей, и считать только те элемены, которые нужны
x=c(-0,2,NA,0.19,0.21)
mean(x[!(is.na(x) | x<0.2)])

Re: Сортировка всего набора данных.

Добавлено: 14 авг 2021, 19:54
_taras_
Сделал в рукопашную
Попробую описать ещё раз.
Имеются несортированные данные по месяцам, которые сведены в одну таблицу. Месяц - отдельный столбец и нету связи между ними. Надобно удалить ненужные данные и сохранить результат.

Re: Сортировка всего набора данных.

Добавлено: 15 авг 2021, 04:11
Ivor
_taras_, так вам и говорят, что вы изначально неверно выбрали метод. Таблица - это всегда зависимость между соседними столбцами. Это её суть и смысл.
То, что вы пытаетесь сделать - это подход Excel. Но Excel - абсолютное зло, он нарушает все понятия, правила и методы (хотя и в нём тоже есть истинные таблицы).
В вашем случае надобно обрабатывать каждый месяц как он есть - то бишь отдельно.