Вопросы с тегом «random-forest»

11
Найти оптимальный P (X | Y), учитывая, что у меня есть модель, которая имеет хорошие показатели при обучении на P (Y | X)

Входные данные: -> особенности футболки (цвет, логотип и т. Д.)XXX -> маржа прибылиYYY Я натренировал случайный лес на вышеуказанных и Y и добился разумной точности на тестовых данных. Так что яXXXYYY .P(Y|X)P(Y|X)P(Y|X) Теперь я хотел бы найти то есть распределение вероятностей X объектов,...

11
Является ли 100% точность модели при превышении данных вне выборки?

Я только что закончил курс машинного обучения для R на cognitiveclass.ai и начал экспериментировать со случайными лесами. Я сделал модель, используя библиотеку randomForest из R. Модель классифицируется по двум классам: хороший и плохой. Я знаю, что, когда модель переоснащена, она хорошо работает...

11
Существуют ли хорошие готовые языковые модели для Python?

Я создаю прототип приложения и мне нужна языковая модель для вычисления недоумения в некоторых сгенерированных предложениях. Есть ли в Python обученная языковая модель, которую я могу легко использовать? Что-то простое, как model = LanguageModel('en') p1 = model.perplexity('This is a well...

11
Несбалансированные классы - Как минимизировать ложные негативы?

У меня есть набор данных, который имеет атрибут бинарного класса. Имеется 623 случая с классом +1 (рак положительный) и 101 671 случай с классом -1 (рак отрицательный). Я пробовал различные алгоритмы (Наивный Байес, Случайный лес, AODE, C4.5), и все они имеют недопустимые ложноотрицательные...

11
Как избежать переобучения в случайном лесу?

Я хочу избежать переобучения в случайном лесу. В связи с этим я намерен использовать mtry, nodeize, maxnodes и т. Д. Не могли бы вы помочь мне выбрать значения для этих параметров? Я использую R. Также, если возможно, скажите, пожалуйста, как я могу использовать перекрестную проверку в k-кратном...

10
Лучшие языки для научных вычислений [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 5 лет назад . Похоже, что большинство языков имеют некоторое...

9
Важность функции через случайный лес и линейную регрессию различны

Применил Лассо для ранжирования функций и получил следующие результаты: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Обратите внимание, что набор данных имеет 3 метки. Ранжирование функций для разных ярлыков одинаково....

9
Экспорт весов (формула) из Случайного Лесного Регрессора в Scikit-Learn

Я обучил модель прогнозирования с помощью Scikit Learn на Python (Random Forest Regressor) и хочу каким-то образом извлечь вес каждой функции, чтобы создать превосходный инструмент для ручного прогнозирования. Единственное, что я нашел, - model.feature_importances_но это не помогает. Есть ли способ...

9
R случайный лес на Amazon ec2 Ошибка: невозможно выделить вектор размером 5,4 Гб

Я тренирую модели случайных лесов на R, используя randomForest()1000 деревьев и фреймы данных с примерно 20 предикторами и 600К строк. На моем ноутбуке все работает нормально, но когда я перехожу на amazon ec2, чтобы запустить то же самое, я получаю ошибку: Error: cannot allocate vector of size 5.4...