Я хотел бы знать, или иметь ссылки на процесс анализа, который проходит большинство статистических аналитиков данных для каждого проекта анализа данных.
Если я составлю «список», для завершения проекта анализа данных аналитик должен:
- сначала собрать требования к проекту,
- планировать / проектировать свой анализ данных на основе этих требований до
- на самом деле предварительная обработка данных,
- выполнение анализа данных и
- написание отчета по результатам анализа.
В этом вопросе меня интересуют более подробные сведения о шаге 2. Но я понимаю, что это не совсем ясно, поскольку аналитику, возможно, придется изменить свой план или дизайн в соответствии с результатами анализа данных. Есть ли какие-либо ссылки на эту тему?
источник
Я нашел «Рабочий процесс анализа данных с использованием Stata» как хорошую книгу, особенно (но не только) для пользователя Stata. Я нашел много, с чем можно не согласиться, но даже это помогло прояснить, почему я делаю вещи определенным образом.
источник
CRISP-DM , созданный компанией SPSS (теперь принадлежит IBM), является аббревиатурой для процесса интеллектуального анализа данных, который аналогичен «анализу данных». SAS имеет аналогичный процесс, называемый SEMMA .
источник