Вопросы с тегом «data.table»

91
dplyr на data.table, я действительно использую data.table?

Если я использую синтаксис dplyr поверх datatable , получу ли я все преимущества скорости от datatable, по-прежнему используя синтаксис dplyr? Другими словами, могу ли я неправильно использовать datatable, если я запрашиваю его с синтаксисом dplyr? Или мне нужно использовать чистый синтаксис...

86
Разделить текстовую строку на столбцы data.table

У меня есть сценарий, который считывает данные из файла CSV в, data.tableа затем разбивает текст в одном столбце на несколько новых столбцов. Я в настоящее время с помощью lapplyи strsplitфункции , чтобы сделать это. Вот пример: library("data.table") df = data.table(PREFIX =...

86
Как применить одну и ту же функцию к каждому указанному столбцу в таблице data.table

У меня есть таблица данных, с которой я хотел бы выполнить ту же операцию с определенными столбцами. Имена этих столбцов даны в векторе символов. В этом конкретном примере я хотел бы умножить все эти столбцы на -1. Некоторые данные игрушки и вектор, определяющий соответствующие столбцы:...

86
dplyr изменить / заменить несколько столбцов в подмножестве строк

Я пытаюсь опробовать рабочий процесс на основе dplyr (вместо того, чтобы использовать в основном data.table, к которому я привык), и я столкнулся с проблемой, что я не могу найти эквивалентное решение dplyr для . Я обычно сталкиваюсь со сценарием, когда мне нужно условно обновить / заменить...

82
Как заменить значения NA в таблице для выбранных столбцов

Есть много сообщений о замене ценностей NA. Я знаю, что можно заменить NA в следующей таблице / кадре следующим: x[is.na(x)]<-0 Но что, если я хочу ограничить его только определенными столбцами? Я покажу вам пример. Во-первых, давайте начнем с набора данных. set.seed(1234) x <-...

18
data.table линейно интерполируя значения NA без групп

Я хотел заполнить некоторые значения NA в data.table без групп. Пожалуйста, рассмотрите этот фрагмент data.table, представляющий время и расстояния: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81,...

12
Преимущества повышения производительности по сравнению с ANDing при фильтрации таблицы данных

У меня есть привычка объединять похожие задачи в одну строку. Например, если мне нужно отфильтровать a, bи cв таблице данных, я положу их вместе в одном[] с Андами. Вчера я заметил, что в моем конкретном случае это было невероятно медленно, и вместо этого проверил фильтры цепочки. Я включил пример...

11
Динамическое мутирование нескольких столбцов при кондиционировании определенных строк

Я знаю, что здесь есть несколько подобных вопросов, но ни один из них, кажется, не решает точную проблему, которая у меня есть. set.seed(4) df = data.frame( Key = c("A", "B", "A", "D", "A"), Val1 = rnorm(5), Val2 = runif(5), Val3 = 1:5 ) Я хочу обнулить значения столбцов значений для строк, где Key...

11
разделить символьные столбцы и получить имена полей в строке

Мне нужно разделить столбец, содержащий информацию, на несколько столбцов. Я бы использовал, tstrsplitно информация такого же рода не в том же порядке среди строк, и мне нужно извлечь имя нового столбца в переменной. Важно знать: может быть много информации (поля, которые станут новыми...

9
Что я не могу сделать с dtplyr, что я могу в data.table

Должен ли я инвестировать свои усилия в обучение для обработки данных в R, особенно между dplyr, dtplyrи data.table? Я использую в dplyrосновном, но когда данные слишком велики для этого, я буду использовать data.table, что встречается редко. Итак, теперь, когда dtplyrv1.0 вышел в качестве...