Случайное назначение является ценным, поскольку оно обеспечивает независимость лечения от возможных результатов. Вот как это приводит к объективным оценкам среднего эффекта лечения. Но другие схемы назначения также могут систематически обеспечивать независимость лечения от возможных результатов. Так зачем нам случайное назначение? Другими словами, в чем преимущество случайного назначения по сравнению со неслучайными схемами назначения, которые также приводят к непредвзятому выводу?
Пусть будет вектором назначений лечения, в котором каждый элемент равен 0 (единица не назначена для лечения) или 1 (единица назначена для обработки). В статье JASA Angrist, Imbens и Rubin (1996, 446-47) говорят, что назначение лечения является случайным, если для всех \ mathbf {c} и \ mathbf {c'}, таких что \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , где \ iota - это вектор столбца со всеми элементами, равными 1. Pr ( Z = c ) = Pr ( Z = c ′ ) c c ′ ι T c = ι T c ′
Другими словами, утверждение состоит в том, что назначение является случайным, если любой вектор назначений, который включает в себя назначений для лечения, столь же вероятен, как и любой другой вектор, который включает в себя назначений для лечения.
Но, чтобы гарантировать независимость потенциальных результатов от назначения лечения, достаточно гарантировать, что каждая единица в исследовании имеет равную вероятность назначения лечения. И это может легко произойти, даже если большинство векторов назначения лечения имеют нулевую вероятность выбора. То есть это может произойти даже при неслучайном присваивании.
Вот пример. Мы хотим провести эксперимент с четырьмя единицами, в которых обрабатываются ровно два. Существует шесть возможных векторов назначения:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
где первая цифра в каждом номере указывает, была ли обработана первая единица, вторая цифра указывает, была ли обработана вторая единица, и так далее.
Предположим, что мы проводим эксперимент, в котором мы исключаем возможность присвоения векторов 3 и 4, но в котором каждый из других векторов имеет равный (25%) шанс выбора. Эта схема не является случайным назначением в смысле AIR. Но в ожидании это приводит к объективной оценке среднего эффекта лечения. И это не случайно. Любая схема назначения, которая дает субъектам равную вероятность назначения лечения, позволит объективно оценить ATE.
Итак: зачем нам случайное назначение в смысле AIR? Мой аргумент основан на рандомизированном заключении; если вместо этого думать с точки зрения основанного на модели вывода, кажется ли определение AIR более оправданным?
Ответы:
Это следует за комментарием Гунга. Общий средний лечебный эффект не имеет значения.
Предположим, у вас есть новых случаев диабета, когда субъект находится в возрасте от 5 до 15 лет , и 1000 новых пациентов с диабетом старше 30 лет . Вы хотите назначить половину лечения. Почему бы не перевернуть монету, и на головах не лечить всех молодых пациентов, а на хвостах не лечить всех пожилых пациентов? Каждый будет иметь 50 %1000 5 15 1000 30 50 % шанс быть выбранным для лечения, так что это не повлияет на средний результат лечения, но отбросит много информации. Не было бы неожиданностью, если бы ювенильный диабет или более молодые пациенты реагировали намного лучше или хуже, чем пожилые пациенты с диабетом типа II или гестационным диабетом. Наблюдаемый эффект лечения может быть непредвзятым, но, например, он будет иметь гораздо большее стандартное отклонение, чем при случайном назначении, и, несмотря на большую выборку, вы не сможете сказать много. Если вы используете случайное распределение, то с высокой вероятностью около случаев в каждой возрастной группе получат лечение, поэтому вы сможете сравнить лечение без лечения в каждой возрастной группе. 500
Вы можете быть в состоянии сделать лучше, чем использовать случайное назначение. Если вы заметили фактор, который, по вашему мнению, может повлиять на реакцию на лечение, возможно, вы захотите убедиться, что субъекты с этим атрибутом разделены более равномерно, чем при случайном назначении. Случайное назначение позволяет вам достаточно хорошо справляться со всеми факторами одновременно, чтобы впоследствии вы могли проанализировать множество возможных моделей.
источник
В вашем примере вы также можете опустить 2 и 5 и не противоречить себе. На уровне предмета все еще есть равный шанс быть 1 или 0, когда шансы 1 или 6 равны 1: 1. Но теперь то, что вы сделали, удалив 3 и 4, становится более очевидным.
источник
Вот еще одна из скрывающихся или смешанных переменных: время (или инструментальный дрейф, эффекты хранения образцов и т. Д.).
Таким образом, существуют аргументы против рандомизации (как говорит Дуглас: вы можете добиться большего успеха, чем рандомизация). Например, вы можете заранее знать, что вы хотите, чтобы ваши дела были сбалансированы с течением времени. Так же, как вы можете заранее знать, что вы хотите сбалансировать пол и возраст.
Другими словами, если вы хотите вручную выбрать одну из 6 своих схем, я бы сказал, что 1100 (или 0011) - это определенно плохой выбор. Обратите внимание, что первые возможности, которые вы выбросили, - это те, которые наиболее сбалансированы во времени ... И худшие два остались после того, как Джон предложил отбросить также 2 и 5 (против которых вы не протестовали).
Другими словами, ваша интуиция о том, какие схемы «хороши», к сожалению, приводит к плохому экспериментальному дизайну (ИМХО, это довольно распространенное явление; возможно, упорядоченные вещи выглядят лучше - и наверняка легче отслеживать логические последовательности во время эксперимента).
Возможно, вы сможете добиться большего успеха с нерандомизированными схемами, но вы также сможете добиться гораздо большего. ИМХО, вы должны быть в состоянии дать физические / химические / биологические / медицинские / ... аргументы для конкретной неслучайной схемы, которую вы используете, если вы идете по неслучайной схеме.
источник