Мне нужно проанализировать с помощью R данные медицинского обследования (с более 100 кодированными столбцами), которое приходит в CSV. Я буду использовать погремушку для некоторого начального анализа, но за кадром это все еще R.
Если я читаю файл .csv () , столбцы с числовыми кодами рассматриваются как числовые данные. Я знаю, что могу создать из них категориальные столбцы с помощью factor (), но сделать это для 100+ столбцов - это очень сложно.
Я надеюсь, что есть лучший способ указать R импортировать столбцы напрямую как факторы. Или, по крайней мере, преобразовать их на месте впоследствии.
Спасибо!
r
categorical-data
data-transformation
wishihadabettername
источник
источник
Ответы:
Вы можете использовать
colClasses
аргумент, чтобы указать классы ваших столбцов данных. Например:присваивает число первому столбцу, коэффициент - второму и третьему. Поскольку у вас так много столбцов, ярлык может быть:
или некоторый такой вариант (то есть присвоение числового значения первому столбцу, коэффициент для следующих 37 столбцов и затем символ для последнего).
источник
или просто сделайте это после того, как прочитали данные
хотя этот тип Q, вероятно, больше подходит для переполнения стека.редактировать : см. ниже.
источник
'T'
и'F'
(преобразуются в логические).