Я только что провел анализ своих данных с использованием логистической регрессии, однако мне также необходимо иметь описательную часть статистики в моем отчете. Я, честно говоря, не вижу в этом смысла, и я надеялся, что кто-то сможет объяснить, почему это необходимо.
Например, если я строю гистограмму одной из моих независимых непрерывных переменных, и она показывает нормальность или асимметрию, как это добавит какое-либо значение в отчет?
Мои данные состоят из зависимой переменной true или false для получения работы, а независимой переменной являются оценки в среднесрочной перспективе, оценки в итоговых экзаменах, а также мужчины или женщины.
descriptive-statistics
reporting
user3223190
источник
источник
Ответы:
В моей области описательная часть отчета чрезвычайно важна, поскольку она устанавливает контекст для обобщения результатов. Например, исследователь хочет идентифицировать предикторов черепно-мозговой травмы после несчастных случаев на мотоцикле в выборке из больницы. Ее зависимая переменная является двоичной, и у нее был ряд независимых переменных. Многовариантная логистическая регрессия позволила ей сделать следующие выводы:
Чтобы было ясно, с моделированием проблем не было. Мы фокусируемся на значении, которое может добавить описательная статистика.
Без описательной статистики читатель не может представить эти результаты в перспективе. Зачем? Позвольте мне показать вам описательную статистику:
Из вышесказанного видно, что ее образец состоял из пожилых, пьяных мужчин. С помощью этой информации читатель может сказать, что, если таковые имеются, эти результаты могут сказать о травмах у молодых мужчин или травмах у нетрезвых наездников или у женщин-наездников.
Пожалуйста, не игнорируйте описательную статистику.
источник
Смысл предоставления описательной статистики состоит в том, чтобы охарактеризовать вашу выборку, чтобы люди в других центрах или странах могли оценить, обобщают ли ваши результаты их ситуацию. Таким образом, в вашем случае табулирование пола, оценок и т. Д. Будет полезным дополнением к логистической регрессии. Это не значит, что люди могут проверить ваши предположения, хотя они могут попытаться сделать это тоже.
============== Изменить, чтобы дать ссылки на некоторые руководящие принципы, используемые в здравоохранении
В области, с которой я знаком, в сфере здравоохранения, существуют конкретные рекомендации по составлению отчетов. Они были собраны вместе в сети EQUATOR, к которой следует обращаться за последними подробностями.
В качестве примера мы можем взять клинические испытания, где соответствующее руководство - CONSORT. В документе с изложением руководства, доступного здесь и в других местах, мы читаем в таблице 1 рекомендацию 15 «Таблица, показывающая исходные демографические и клинические характеристики для каждой группы».
Есть аналогичные рекомендации для других типов исследований.
источник
Другое дело показать, насколько хорошо ведут себя ваши переменные. Если, например, одной из ваших переменных является зарплата, и вы опросили ровно одного миллиардера, то, когда вы введете его зарплату в логистическую регрессию, она будет доминировать над всем остальным, поэтому вы, вероятно, научитесь игнорировать зарплату, независимо от того, сколько фактической информации он может содержать.
Некоторые методы более чувствительны, чем другие, к асимметрии и экстремальным значениям, и логистическая регрессия скорее на чувствительной стороне. Конечно, окончательное доказательство в пудинге, и вы можете сравнить результаты, полученные с необработанными данными, или с каждым признаком, преобразованным в нормальное состояние.
источник
Описательная часть помогает понять читателю ваш набор данных. В прикладной экономике это обычно настоятельно рекомендуется, поскольку это может показать первые потенциальные недостатки в вашем анализе.
Вы можете использовать данные из разных источников, чтобы взорвать ваши описания.
1 таблицы должно быть достаточно. Тот, который вы прикрепили, не очень интуитивно понятен.
источник