Я беру интервью у людей на позицию разработчика / исследователя алгоритма в контексте статистики / машинного обучения / интеллектуального анализа данных.
Я ищу вопросы, которые нужно задать, чтобы определить, в частности, знакомство, понимание и гибкость кандидата с базовой теорией, например, основные свойства ожидания и дисперсии, некоторые общие распределения и т. Д.
Мой текущий вопрос: «Существует неизвестное количество которое мы хотели бы оценить. Для этого у нас есть оценки которые, учитывая , все несмещены и независимы, и каждый имеет известная дисперсия , отличающаяся для каждого. Найдите оптимальный оценщик который является несмещенным и имеет минимальную дисперсию. "
Я ожидаю, что любой серьезный кандидат с легкостью справится с этим (если у него есть время для проработки расчетов), и все же я удивлен тем, сколько кандидатов, предположительно из соответствующих областей, не смогли добиться даже минимального прогресса. Поэтому я считаю это хорошим дискриминационным вопросом. Единственная проблема с этим вопросом заключается в том, что он только один.
Какие еще вопросы можно использовать для этого? Кроме того, где я могу найти коллекцию таких вопросов?
источник
Ответы:
Что вы хотите, чтобы ваш статистический разработчик делал?
Армия США говорит: «Тренируйся, ты будешь сражаться, потому что ты будешь сражаться так, как тебя тренировали». Проверьте их на то, что вы хотите, чтобы они делали весь день. Действительно, вы хотите, чтобы они «создавали ценность» или «зарабатывали деньги» для компании.
Босс 101
Думай "покажи мне деньги".
Примечание. Если ваш вопрос о символических манипуляциях не связан с «деньгами», то вы, возможно, задаете не тот вопрос.
Есть 3 вещи, которые каждый сотрудник должен сделать, чтобы стать сотрудником:
Если ты не получишь это, то никакой другой ответ не принесет тебе никакой пользы.
Если вы можете заменить их хорошим программным обеспечением или хорошо обученным подростком, то вам в конечном итоге придется это сделать, и это будет стоить вам.
Данные 101
Что они должны быть в состоянии сделать:
говоря, кластер / классификация), как это связано с этим (регрессия / подгонка, включая линейные модели, glm, радиальная основа,
разностные уравнения), верно ли, что «(проверка гипотез), сколько образцов мне нужно (приемочная выборка), как я могу получить наибольшее количество
данных из нескольких / дешевых / эффективных экспериментов (статистический дизайн
эксперимента) - отказ от ответственности, я инженер, а не статистик. Вы можете спросить их вопрос "каковы различные фундаментальные задачи и как вы проверяете, может ли статистика выполнять их эффективно и правильно?"
Они должны быть в состоянии читать из CSV, XLSX (Excel), SQL и
изображений. (HDF5, Rdata) Если у вас есть собственный формат, он должен
иметь возможность читать его и работать с инструментами быстро и
эффективно. Они должны знать силу / слабость формата. CSV - это быстрое использование, он был всегда, быстрый прототип, но раздутый, неэффективный и медленный.
люди говорят, что «есть ложь, проклятая ложь и статистика», но не в моей
компании. Тот же хороший ввод дает тот же хороший вывод. Выходные данные не являются числом, это всегда бизнес-решение, которое информирует о
технических действиях и приводит к бизнес-результату. Различные тесты могут установить циферблат на 5,5 или 6,5, но возможность всегда выше 1,33.
лица, принимающие решения, и / или разработчики миньонов, и / или сами могут
понять в течение года с наименьшими ошибками. Прекрасная вещь - это способность объяснить это, чтобы ваша бабушка поняла это. Это ( ссылка ) мой ответ, но мне это нравится.
Аналитические зингеры:
Я думаю, что невозможные вопросы - это здорово. Они невозможны по причине. Быть способным узнать, невозможно ли что-то за воротами, - это хорошо. Знание почему, наличие некоторых способов привлечь его или возможность задать другой вопрос может быть лучше.
Другие вопросы CV. ( ссылка ) На реддит. ( ссылка ) другие ( ссылка )
Кстати, это был хороший вопрос. Возможно, мне придется обновить этот ответ с течением времени.
источник