Кто-нибудь знает R, эквивалентный SAS PROC FREQ
?
Я пытаюсь создать сводную описательную статистику для нескольких переменных одновременно.
Кто-нибудь знает R, эквивалентный SAS PROC FREQ
?
Я пытаюсь создать сводную описательную статистику для нескольких переменных одновременно.
Ответы:
Я использую
table
иprop.table
, ноCrossTable
вgmodels
пакете может дать вам результаты даже ближе к SAS. Смотрите эту ссылку .Кроме того, чтобы создать «описательную статистику для нескольких переменных одновременно», вы должны использовать
summary
функцию; например,summary(mydata)
.источник
Обобщение данных в базе R - просто головная боль. Это одна из областей, где SAS работает достаточно хорошо. Для R, я рекомендую
plyr
пакет.В САС:
с
plyr
:источник
Я не использую SAS; поэтому я не могу прокомментировать, воспроизводятся ли следующие
SAS PROC FREQ
, но это две быстрые стратегии для описания переменных в data.frame, которые я часто использую:describe
вHmisc
предоставляет полезную сводку переменных, включая числовые и нечисловые данныеdescribe
вpsych
обеспечивает описательную статистику для числовых данныхПример R
Следующее является результатом
Hmisc
describe
:Затем ниже вывод
psych
describe
для числовых переменных:источник
Я использую функцию кодовой книги из {EPICALC}, которая дает сводную статистику для числовой переменной и таблицу частот с метками уровня и кодами для факторов. http://cran.r-project.org/doc/contrib/Epicalc_Book.pdf (см. стр. 50). Кроме того, это очень полезно, поскольку предоставляет sd для количественных переменных.
Наслаждайтесь !
источник
codebook()
это изложено. 1 проблема в том, чтоna
s отброшены, что вы можете включить в ваш вывод. 1 способ справиться с этим (по крайней мере, с учетом факторов) - использовать ? Recode.is.na 1st (например, «отсутствующий»); для числовых переменных вы можете создать новую переменную непосредственно слева от столбца с логическим значением на основеis.na()
, а затем запуститьcodebook()
. Это немного клуге, хотя.Вы можете проверить мой пакет summarytools ( ссылка на CRAN ), который включает функцию, подобную кодовой книге, с опциями форматирования markdown и html.
Сводка данных
СО2
РЕДАКТИРОВАТЬ
В более новых версиях summarytools
freq()
функция (которая создает простые таблицы частот, более точные по отношению к исходному вопросу) принимает кадры данных, а также отдельные переменные. Для кросс-таблиц (которые также делает proc freq ), смотритеctable()
функцию.частоты
$ Plant CO2Тип : Упорядоченный фактор
CO2 $ ТипТип : Фактор
$ Лечение CO2Тип : Фактор
источник
Спасибо всем за предложения. В итоге я использовал функцию таблицы или Rcmdr numSummary и применил:
Это работает довольно хорошо и не слишком неудобно. Однако я обязательно попробую некоторые из этих решений!
источник