Я ученый, работающий в области интеллектуального анализа данных. Не секрет, что ученые-компьютерщики довольно плохо проводят систематический экспериментальный дизайн и оценку - использование p-значений и оценок достоверности считается продвинутым :).
Что я хотел бы знать, если есть хорошие курсы / материалы, чтобы научить компьютерщиков о хорошем экспериментальном дизайне. Чтобы сделать это более конкретным, я добавлю следующую информацию:
- Курс должен быть ориентирован на аспирантов, которые, как можно предположить, имеют разумное понимание вероятности, но ограниченный опыт в области статистики.
- Курс должен быть сфокусирован на экспериментальном дизайне в «неконтролируемых неестественных условиях»: другими словами, нет ни основополагающей физической основы, ни способа управления процессом сбора данных (как у людей). Конечно, хороший курс будет сосредоточен на основах, но он должен иметь дело с этим сценарием в значительной степени.
- Вычислительный элемент будет бонусом, но не обязательным. Мы имеем дело с большим количеством данных, но в случае необходимости можем сами разобраться с вычислительными проблемами.
references
experiment-design
Суреш Венкатасубраманян
источник
источник
Ответы:
[Ноа Смит] [1] и [Дэвид Смит] [2] предложили курс некоторое время назад в JHU с аналогичными мотивами.
Контур:
Подробнее см. «Эмпирические методы исследования в информатике» (600.408) http://www.cs.jhu.edu/~nasmith/erm/
источник
Я мог бы предложить вам две книги вместо курсов
Первый, как приложение к биоинформатике и второй для любой дисциплины
источник
Хороший вопрос. Я стремлюсь увидеть ответы.
С точки зрения статистики необходимо решить две проблемы: большинство статистических и статистических схем обсуждают статистику небольших выборок, а большинство методологий, используемых инженерами, не являются «современной» статистикой.
У меня нет непосредственного предложения по первой проблеме, помимо хорошего обучения в области добычи / исследования данных и значения статистически различного при анализе статистики населения (или большой выборки).
Однако две книги, представляющие интерес для ознакомления студентов со статистикой, будут принадлежать Рэнду Уилкоксу (психологу):
Wilcox, RR (2012). Введение в робастную оценку и проверку гипотез, 3-е изд. Академическая пресса.
Wilcox, RR (2010). Основы современных статистических методов: значительное улучшение мощности и точности, Springer, 2-е изд.
источник