Вопросы с тегом «dplyr»

96
dplyr: «Ошибка в n (): функцию нельзя вызывать напрямую»

Я пытаюсь воспроизвести один из примеров из пакета dplyr, но получаю это сообщение об ошибке. Я ожидаю увидеть новый столбец n с частотой каждой комбинации. Что мне не хватает? Я трижды проверил, что пакет загружен. library(dplyr) # summarise peels off a single layer of grouping by_vs_am <-...

94
Как интерпретировать сообщение dplyr `summarize ()`, перегруппировывающее вывод по 'x' (переопределить с помощью аргумента `.groups`)?

Я начал получать новое сообщение (см. Заголовок сообщения) при запуске group_by и summarize () после обновления до версии разработки dplyr 0.8.99.9003. Вот пример воссоздания вывода: library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males,...

93
Получение лучших значений по группе

Вот пример фрейма данных: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Я хочу, чтобы подмножество dсодержало строки с 5 верхними значениями xдля каждого значения grp. Используя base-R, мой подход будет примерно таким: ordered <- d[order(d$x, decreasing = TRUE), ] splits <-...

93
R Условная оценка при использовании оператора вертикальной черты%>%

При использовании оператора трубы %>%с пакетами , такими как dplyr, ggvis, dychartsи т.д., как я делаю шаг условно? Например; step_1 %>% step_2 %>% if(condition) step_3 Эти подходы, похоже, не работают: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>%...

91
dplyr на data.table, я действительно использую data.table?

Если я использую синтаксис dplyr поверх datatable , получу ли я все преимущества скорости от datatable, по-прежнему используя синтаксис dplyr? Другими словами, могу ли я неправильно использовать datatable, если я запрашиваю его с синтаксисом dplyr? Или мне нужно использовать чистый синтаксис...

89
Как указать имена столбцов для x и y при объединении в dplyr?

У меня есть два фрейма данных, к которым я хочу присоединиться с помощью dplyr. Один - это фрейм данных, содержащий имена. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) Другой фрейм данных содержит очищенную версию корпуса имен...

87
dplyr мутировать с условными значениями

В большом фрейме данных («myfile») с четырьмя столбцами мне нужно добавить пятый столбец со значениями, условно основанными на первых четырех столбцах. Предпочитайте ответы с dplyrи mutate, главным образом из-за его скорости в больших наборах данных. Мой фрейм данных выглядит так: V1 V2 V3 V4 1 1...

86
dplyr изменить / заменить несколько столбцов в подмножестве строк

Я пытаюсь опробовать рабочий процесс на основе dplyr (вместо того, чтобы использовать в основном data.table, к которому я привык), и я столкнулся с проблемой, что я не могу найти эквивалентное решение dplyr для . Я обычно сталкиваюсь со сценарием, когда мне нужно условно обновить / заменить...

83
Выбор столбцов на основе совпадения строк - dplyr :: select

У меня есть фрейм данных («данные») с множеством столбцов. Некоторые столбцы содержат определенную строку ("search_string"). Как я могу использовать, dplyr::select()чтобы дать мне подмножество, включающее только столбцы, содержащие строку? Я старался: # columns as boolean vector select(data,...

18
Как заменить NA с набором значений

У меня есть следующий фрейм данных: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Это выглядит так: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b 5 3 c NA 4 d 3 5 e NA То, что я хочу...

13
Использование нестандартной оценки на основе Tidyeval при перекодировании в правой части mutate

Рассмотрим тиббл, где каждый столбец является символьным вектором, который может принимать много значений - скажем, от «A» до «F». library(tidyverse) sample_df <- tibble(q1 = c("A", "B", "C"), q2 = c("B", "B", "A")) Я хочу создать функцию, которая принимает имя столбца в качестве аргумента и...

12
Как поворачивать фрейм данных, состоящий из столбца с разделом и подразделом в R

У меня есть нижеупомянутый фрейм данных: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16...

11
Динамическое мутирование нескольких столбцов при кондиционировании определенных строк

Я знаю, что здесь есть несколько подобных вопросов, но ни один из них, кажется, не решает точную проблему, которая у меня есть. set.seed(4) df = data.frame( Key = c("A", "B", "A", "D", "A"), Val1 = rnorm(5), Val2 = runif(5), Val3 = 1:5 ) Я хочу обнулить значения столбцов значений для строк, где Key...

10
Условие фильтра dplyr для различения символа Юникода и его представления в Юникоде

Я пытаюсь отфильтровать столбец Символ на основе его формы \uxxxx Это очень просто визуально, то есть, некоторые выглядят как $, ¢, £, и другие , как \u058f, \u060b, \u07fe. Но я не могу понять это с помощью stringi/dplyr library(dplyr) library(stringi) df <- structure(list(Character =...

9
Эффективный способ отбрасывать строки с перекрытием времени

У меня длинный набор данных со столбцами, представляющими время начала и окончания, и я хочу отбросить строку, если она перекрывается с другой и имеет более высокий приоритет (например, 1 - самый высокий приоритет). Мой пример данных library(tidyverse) library(lubridate) times_df <- tibble(start...

9
Что я не могу сделать с dtplyr, что я могу в data.table

Должен ли я инвестировать свои усилия в обучение для обработки данных в R, особенно между dplyr, dtplyrи data.table? Я использую в dplyrосновном, но когда данные слишком велики для этого, я буду использовать data.table, что встречается редко. Итак, теперь, когда dtplyrv1.0 вышел в качестве...