Значение оси Y на графике частичной зависимости Random Forest

13

Я использую RandomForestпакет R и не понимаю, как интерпретировать значения оси Y на графиках их частичной зависимости. Справочные документы утверждают, что график представляет собой «графическое изображение предельного влияния переменной на вероятность класса». Тем не менее, я все еще не понимаю, что именно представляет ось Y.

  • В частности, что означают отрицательные значения?
  • Что значит иметь негативное влияние на точное предсказание класса?
  • И что является наиболее важной характеристикой этих цифр, это максимальное значение, форма тренда и т. Д.?
  • Можете ли вы сравнить частичные графики с частичными графиками других переменных?
  • Как эти графики могут сравниваться с кривыми отклика, созданными в Maxent (программное обеспечение для моделирования распределения)?

Некоторые примеры графиков частичной зависимости

jacobsap
источник

Ответы:

7

Отвечая на эти два вопроса в первую очередь:

В частности, что означают отрицательные значения? Что значит иметь негативное влияние на точное предсказание класса?

Если вы посмотрите на определение того, как частичный график вычисляется в документации пакета Random Forest , он говорит, что графики показывают относительный логитный вклад переменной в вероятность класса с точки зрения модели. Другими словами, отрицательные значения (по оси Y) означают, что положительный класс менее вероятен для этого значения независимой переменной (по оси X) в соответствии с моделью. Точно так же положительные значения означают, что положительный класс более вероятен для этого значения независимой переменной в соответствии с моделью. Ясно, что ноль не подразумевает никакого среднего влияния на классовую вероятность согласно модели.

И что является наиболее важной характеристикой этих цифр, это максимальное значение, форма тренда и т. Д.?

Существует много разных подходов для определения важности функции, и максимальное абсолютное значение - это всего лишь одна простая мера. Как правило, люди смотрят на форму частичных графиков, чтобы собрать понимание того, что модель предлагает в отношении отношений от переменных к меткам классов.

Можете ли вы сравнить частичные графики с частичными графиками других переменных?

Ответ на это менее черно-белый. Вы можете определенно взглянуть на диапазон оси Y для каждого графика; Если частичная зависимость от одной переменной близка к нулю для всего диапазона переменной, это говорит о том, что модель не имеет никакого отношения от переменной к метке класса. Возвращаясь к вашему вопросу, чем больше диапазон, тем сильнее влияние в целом, поэтому в этом смысле их можно сравнивать.

У меня нет опыта работы с Максентом.

Крис А.
источник
Скажем, модель для классификации 2 классов, как определить, какой класс является положительным классом, а какой отрицательным?
Кумар Вайбхав,
Это хороший вопрос, вам придется поэкспериментировать и посмотреть. Документация говорит на странице 17 здесь, что если yэто фактор, то предполагается, что это проблема классификации. Однако он не говорит, какой фактор будет отображаться в положительном или отрицательном классе. Я хотел бы надеяться, что 1 или true сопоставлены с положительным классом, а 0, -1 или false сопоставлены с отрицательным классом, но я бы не принял это как должное в R.
Крис А.
в which.classаргументе есть аргумент, partialPlotи по умолчанию используется первый уровень фактора y. Таким образом, если первый уровень yявляется отрицательным случаем, то partialPlotбудет предсказывать отрицательные случаи, которые могут не соответствовать ожиданиям.
Кохелет