Вопросы с тегом «project-management»

Организация вычислительной работы над * статистическими * проектами; используйте для вопросов о хранении данных, совместном использовании данных, репозиториях кода и т. д. Обратите внимание, что вопросы о программировании или не связанные со статистикой не по теме.

89
Как эффективно управлять проектом статистического анализа?

Мы часто слышим о шаблонах управления проектами и проектирования в компьютерных науках, но реже в статистическом анализе. Тем не менее, кажется, что решающим шагом на пути к созданию эффективного и долгосрочного статистического проекта является обеспечение организованности. Я часто выступаю за...

34
Почему существует разница между ручным вычислением 95-процентного доверительного интервала и использованием функции confint () в R?

Дорогие, я заметил нечто странное, что не могу объяснить, не так ли? В итоге: ручной подход к вычислению доверительного интервала в модели логистической регрессии и функция R confint()дают разные результаты. Я проходил Прикладную логистическую регрессию Хосмера и Лемешоу (2-е издание). В 3-й главе...

32
Почему запятая является плохим разделителем / разделителем записей в файлах CSV?

Я читал эту статью, и мне любопытно найти правильный ответ на этот вопрос. Единственное, что мне приходит в голову, это, возможно, то, что в некоторых странах десятичный разделитель - это запятая, и это может быть проблемой при обмене данными в CSV , но я не совсем уверен в своем...

31
Как повысить долгосрочную воспроизводимость исследований (особенно с использованием R и Sweave)

Контекст: в ответ на предыдущий вопрос о воспроизводимых исследованиях Джейк написал Одна проблема, которую мы обнаружили при создании нашего архива JASA, заключалась в том, что версии и значения по умолчанию пакетов CRAN изменились. Итак, в этот архив мы также включили версии пакетов, которые мы...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

23
Каковы эффективные способы организации R кода и вывода? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Я ищу информацию о том, как другие организуют свой код R и вывод. Моя текущая практика заключается в...

22
Как контролировать предварительные анализы больших наборов данных?

Когда я начинаю исследовательский анализ большого набора данных (много выборок, много переменных), я часто оказываюсь с сотнями производных переменных и тоннами разных графиков, и у меня нет реального способа отслеживать, что и где происходит. Код заканчивается как спагетти, потому что нет...

18
Стратегия редактирования файлов с разделением запятыми (CSV)

Когда я работаю над проектами по анализу данных, я часто храню данные в файлах данных с разделителями-запятыми (CSV, TSV). При этом данные часто принадлежат к выделенной системе управления базами данных. Для многих моих приложений это было бы слишком. Я могу редактировать файлы CSV и TSV в Excel...

17
Простой, надежный, открытый и совместимый текстовый формат для хранения данных

В предыдущем вопросе я спрашивал об инструментах для редактирования файлов CSV . Гэвин ссылается на комментарий к R Help Дункана Мердока, в котором говорится, что формат обмена данными является более надежным способом хранения данных, чем CSV. Для некоторых приложений необходима выделенная система...

15
Что такое практически хороший процесс анализа данных?

Я хотел бы знать, или иметь ссылки на процесс анализа, который проходит большинство статистических аналитиков данных для каждого проекта анализа данных. Если я составлю «список», для завершения проекта анализа данных аналитик должен: сначала собрать требования к проекту, планировать / проектировать...

11
Улучшение имен переменных в наборе данных

Хорошие имена переменных: а) короткий / легкий для ввода, б) легко запомнить, в) понятный / коммуникативный. Я забыл что-нибудь? Последовательность - это то, что нужно искать. Я бы сказал, что согласованные соглашения об именах способствуют достижению указанных выше качеств. Последовательность...