Я только что обнаружил comment
функцию в R. Пример:
x <- matrix(1:12, 3,4)
comment(x) <- c("This is my very important data from experiment #0234",
"Jun 5, 1998")
x
comment(x)
Это первый раз, когда я пришел с этой функцией, и мне было интересно, как часто / полезно ее использовать. Так как в Google довольно сложно найти "R comment" и найти релевантные результаты, я надеялся, что кто-то здесь поделится своим опытом.
Ответы:
Во-вторых, @Gavin, Фрэнк Харрелл разработал эффективные способы обработки аннотированных data.frame в R в своем пакете Hmisc . Например,
label()
иunits()
функции позволяют добавлять специальные атрибуты объектов R. Я нахожу их очень удобными при создании сводки data.frame (например, сdescribe()
).Еще один полезный способ использования такого дополнительного атрибута - применить временную метку к набору данных. Я также добавляю атрибут для таких вещей, как случайное начальное число, номер сгиба (когда я использую перекрестную проверку k-kold или LOO).
источник
Одна вещь, которую я часто обнаруживаю в своих R-скриптах для конкретной задачи анализа данных, - это включение в скрипт комментариев о единицах переменных в моих фреймах данных. Я работаю с данными об окружающей среде, и химикам и экологам, похоже, нравится использовать широкий диапазон различных единиц для одних и тех же вещей (мг л против му экв л и т. Д.). Мои коллеги обычно хранят эту информацию в строке непосредственно под именами столбцов на листах Excel.- 1−1 −1
Я считаю
comment()
хорошим способом прикрепления этой информации к фрейму данных для дальнейшего использования.источник
comment()
это не комментарии в коде. Он прикрепляет к объекту определенный атрибут, который может быть вектором, один элемент на столбец фрейма данных, содержащий информацию о единицах. Эту информацию легко извлечь, поэтому я не понимаю, почему реализовать что-либо было бы сложно или невозможно?R
- определенно не является подходящим местом для поддержки баз данных и выполнения процессов такого типа, даже если он способен на это. Лучше всего дополняется хорошей системой управления базами данных для такой работы.comment()
и др. удобны для специальных заметок и информации, но для крупномасштабной обработки данных требуется надлежащая система. Интересно, что сейчас мы должны решить эту проблему в исследовательской группе и консультанте, в котором я работаю, в отношении наших данных по химии, и нам необходимо поместить их в надлежащую базу данных.Подобные возможности существуют в других пакетах, таких как -notes- команда в Stata . Мы используем это, чтобы документировать полную информацию о переменной, например, подробности анализа для биохимического измерения или точную формулировку вопроса, задаваемого для данных вопросника. Часто это слишком много информации для имени переменной или метки, одна или обе из которых отображаются в выходных данных каждого анализа, включающего переменную, и, следовательно, их лучше сохранять достаточно короткими.
источник
Одна из вещей, которые я часто выполняю, - это отслеживание команд, используемых для генерации данных и объектов, и нашел комментарий для этого полезным инструментом.
'Matched.call.data' и 'generate.command.string' делают свое дело. Не идеально, но полезно и используется для 'comment ()'. :)
источник
Позвольте мне предложить мое общее решение для управления объектами в R:
repo
пакет. Используя его, вы можете назначить каждой переменной длинное имя, описание, набор тегов, удаленный URL, отношения зависимостей, а также прикрепить рисунки или общие внешние файлы. Например, исходный код может быть сохранен как элемент репозитория и присоединен к ресурсам, созданным им. Найдите последнюю стабильную версию CRAN (install.packages("repo")
) или последнюю версию на github . Краткий обзор здесь . Надеюсь, это поможет.источник