Для задачи байесовской логистической регрессии я создал апостериорное предиктивное распределение. Я выбираю из прогнозирующего распределения и получаю тысячи выборок (0,1) для каждого наблюдения, которое у меня есть. Визуализация пригодности менее интересна, например:
На этом графике показаны 10 000 образцов + наблюдаемая исходная точка (слева можно разглядеть красную линию: да, это наблюдение). Проблема в том, что этот график вряд ли информативен, и у меня будет 23 из них, по одному на каждую точку данных.
Есть ли лучший способ визуализировать 23 точки данных плюс задние образцы.
Еще одна попытка:
Еще одна попытка на основе бумаги здесь
bayesian
data-visualization
classification
goodness-of-fit
binary-data
Cam.Davidson.Pilon
источник
источник
Ответы:
Я чувствую, что вы не совсем отказываетесь от всех товаров в вашей ситуации, но, учитывая то, что у нас есть, давайте рассмотрим полезность простого точечного графика для отображения информации.
Единственная реальная вещь, которую здесь не нужно (это, возможно, не поведение по умолчанию):
Сортировка - настоящий кикер для таких точек. Сортировка по значениям пропорции помогает легко обнаружить высокие остаточные наблюдения. Наличие системы, в которой вы можете легко сортировать значения, содержащиеся в графике или во внешних характеристиках кейсов, - лучший способ получить прибыль.
Этот совет распространяется и на постоянные наблюдения. Вы можете раскрасить / сформировать точки в зависимости от того, является ли остаток отрицательным или положительным, а затем изменить размер точки в соответствии с абсолютным (или квадратом) остатком. Это ИМО не нужно здесь, хотя из-за простоты наблюдаемых значений.
источник
Обычный способ визуализации соответствия байесовской модели логистической регрессии с одним предиктором состоит в построении прогностического распределения вместе с соответствующими пропорциями. (Пожалуйста, дайте мне знать, если я понял ваш вопрос)
Пример использования популярного набора данных Bliss.
Код ниже в R:
источник
ni = 23
иno = 7
каждый из 23 людей имеют разныеdose
. Вы можете сделать аналогичный график для данных ОП, хотя, (точки расположены на 0 или 1 на оси Y, и вы строите график функции). Посмотрите некоторые примеры подобных графиков для логистической регрессии в ссылках, которые я даю на этот ответ .Я отвечаю на запрос альтернативных графических методов, которые показывают, насколько хорошо смоделированные события отказа соответствуют наблюдаемым событиям отказа. Вопрос возник в "Вероятностном программировании и байесовских методах для хакеров", найденном здесь . Вот мой графический подход:
Код найден здесь .
источник