Вопросы с тегом «r-faq»

154
Агрегировать / суммировать несколько переменных на группу (например, сумма, среднее)

Из кадра данных, есть простой способ агрегации ( sum, mean, maxодновременно с) и др несколько переменных? Ниже приведены некоторые примеры данных: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 =...

152
Заменить все 0 значений на NA

У меня есть фреймворк с несколькими числовыми столбцами. Некоторая строка имеет значение 0, которое при статистическом анализе следует рассматривать как нулевое. Каков самый быстрый способ заменить все значения 0 на NULL в R?...

152
Удалить дублирующиеся строки

Я прочитал CSV файл в R data.frame. Некоторые строки имеют одинаковый элемент в одном из столбцов. Я хотел бы удалить строки, которые являются дубликатами в этом столбце. Например: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus 202...

150
Замена NA на последнее значение, отличное от NA

В data.frame (или data.table) я хотел бы «заполнить вперед» NA ближайшим предыдущим значением, отличным от NA. Вот простой пример использования векторов (вместо a data.frame): > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Мне нужна функция, fill.NAs()которая позволяет мне создавать yyтакие,...

149
R управление памятью / невозможно выделить вектор размером n Мб

Я сталкиваюсь с проблемами, пытаясь использовать большие объекты в R. Например: > memory.limit(4000) > a = matrix(NA, 1500000, 60) > a = matrix(NA, 2500000, 60) > a = matrix(NA, 3500000, 60) Error: cannot allocate vector of size 801.1 Mb > a = matrix(NA, 2500000, 60) Error: cannot...

147
Добавить легенду к линейному графику ggplot2

У меня вопрос по легендам в ggplot2. Мне удалось построить три линии на одном графике, и я хочу добавить легенду с использованием трех цветов. Это используемый код library(ggplot2) require(RCurl) link<-getURL("https://dl.dropbox.com/s/ds5zp9jonznpuwb/dat.txt") datos<-...

144
Как вы используете «<< -» (задание области видимости) в R?

Я только что закончил читать об области видимости во введении R , и мне очень интересно узнать о <<-назначении. В руководстве приведен один (очень интересный) пример <<-, который, как мне кажется, я понял. Мне все еще не хватает контекста, когда это может быть полезно. Так что я бы...

137
Упорядочить дискретную шкалу х по частоте / значению

Я делаю точечную гистограмму, используя ggplot с дискретной шкалой x, ось x теперь расположена в алфавитном порядке, но мне нужно изменить ее так, чтобы она упорядочивалась по значению оси y (т. Е. Самая высокая полоса будет располагаться слева). Я попытался упорядочить или отсортировать, но в...

134
Установка более старой версии пакета R

Я пытаюсь использовать Rpy2 и ggplot2, но получаю сообщение об ошибке. После некоторого поиска ошибки в Интернете я обнаружил, что ошибка возникает из-за изменений в пакете ggplot2, которые еще не отражены в Rpy2 (например, см. Этот пост (Изменить: ссылка теперь мертва)). Итак, теперь мне нужно...

134
Только читать выбранные столбцы

Может ли кто-нибудь сказать мне, как читать только первые 6 месяцев (7 столбцов) для каждого года данных ниже, например, используя read.table()? Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2010 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21...

131
Как искать материалы категории «R»? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме переполнения стека. Закрыто 7 лет назад . Улучшить этот вопрос "Google" очень полезен ... если только ваш язык не называется "R", и в этом случае...

125
Что означает «методы S3» в R?

Поскольку я новичок в R, я не знаю, что такое методы и объекты S3. Я обнаружил, что существуют объектные системы S3 и S4, и некоторые рекомендуют по возможности использовать S3 вместо S4 (см. Руководство по стилю R от Google по адресу...

122
Динамически выбирать столбцы фрейма данных с помощью $ и символьного значения

У меня есть вектор с разными именами столбцов, и я хочу иметь возможность перебирать каждый из них, чтобы извлечь этот столбец из data.frame. Например, рассмотрим набор данных mtcarsи некоторые имена переменных, хранящиеся в векторе символов cols. Когда я пытаюсь выбрать переменную из...

121
Подсчитайте количество строк в каждой группе

У меня есть фрейм данных, и я хотел бы подсчитать количество строк в каждой группе. Я регулярно использую эту aggregateфункцию для суммирования данных следующим образом: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Теперь я хотел бы посчитать наблюдения, но не могу найти подходящего...

120
Общие предложения по отладке в R

Я получаю сообщение об ошибке при использовании написанной мной функции R: Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: algorithm did not converge Что я наделал: Пройдите через функцию Добавление print, чтобы узнать, в какой строке происходит ошибка, предлагает две функции,...

120
Что означает функция%>% в R?

Я видел использование функции %>%(процент больше, чем процент) в некоторых пакетах, таких как dplyr и rvest . Что это означает? Это способ писать закрывающие блоки в...