Визуализация многих искаженных распределений

10

У меня есть серия дистрибутивов с левосторонним и тяжелым хвостом, которые я хотел бы показать. Есть 42 распределения через три фактора (помечено как A, Bи Cниже). Кроме того, изменение сокращается через фактор B.

У меня проблема в том, что распределение трудно дифференцировать по шкале результата (соотношение или кратное изменение):

введите описание изображения здесь

Регистрация данных, кажется, чрезмерно подчеркивает левую асимметрию и перемещает больше выборок в хвосты (создавая массу точек выброса):

введите описание изображения здесь

У кого-нибудь есть предложения по другим методам визуализации этих данных?

topepo
источник
5
Ведение журнала часто используется для уменьшения перекоса вправо, поэтому можно ожидать, что оно увеличит перекос влево. Это exp()обратное преобразование, но это, вероятно, слишком сильно здесь. Квадрат является более мягкой альтернативой. Вы не говорите, какой размер выборки у вас есть. Не очевидно, что главная проблема - это действительно левая асимметрия, а не несколько умеренных выбросов в левом хвосте в B1. Здесь нет науки, чтобы пролить свет на это?
Ник Кокс
1
Размер выборки на один блок-график составляет около 100. Значения представляют собой ускорения, достигнутые новым вычислительным алгоритмом (т. Е. Старое время выполнения / новое время выполнения). Есть случаи, когда это не приводит к значительной экономии времени, поэтому распределения имеют тенденцию уходить влево.
Топепо
Спасибо. Количество очков за пределами усов, кажется, тогда довольно мало.
Ник Кокс
3
Что в этих дистрибутивах вы хотите увидеть лучше? Текущий сюжет выглядит хорошо для меня: C имеет очень мало, если таковые имеются, разница; более высокий B делает более узкие и более низкие распределения; и выше А идет с более высокими значениями.
gung - Восстановить Монику

Ответы:

0

Просто идея: если вы можете описать распределения, которые вы получили относительно хорошо с нормальным распределением, вы можете сделать двухмерные графики, показывающие влияние A, Bи Cна параметры подобранного распределения: среднее и стандартное отклонение.

Или вы пытаетесь найти другие описывающие показатели для полученного вами распределения и показать влияние трех переменных на них.

Если вы обнаружите, что две переменные имеют взаимодействие, вы можете сделать трехмерный график. Будем надеяться, что они не все взаимодействуют друг с другом. ;)

Эльмар Мацек
источник