Вопросы с тегом «feature-selection»

11
Существуют ли хорошие готовые языковые модели для Python?

Я создаю прототип приложения и мне нужна языковая модель для вычисления недоумения в некоторых сгенерированных предложениях. Есть ли в Python обученная языковая модель, которую я могу легко использовать? Что-то простое, как model = LanguageModel('en') p1 = model.perplexity('This is a well...

11
Какой из них первый: бенчмаркинг алгоритмов, выбор функций, настройка параметров?

При попытке сделать, например, классификацию, мой подход в настоящее время заключается в сначала попробуйте различные алгоритмы и сравните их выполнить выбор функции по лучшему алгоритму из 1 выше настроить параметры, используя выбранные функции и алгоритм Однако я часто не могу убедить себя, что...

11
Техника извлечения признаков - суммирование последовательности данных

Я часто строю модель (классификацию или регрессию), где у меня есть некоторые предикторные переменные, которые являются последовательностями, и я пытался найти технические рекомендации для их обобщения наилучшим образом, чтобы включить их в качестве предикторов в модель. В качестве конкретного...

10
Отбор характеристик и соотношение точности классификации

Одна из методологий выбора подмножества доступных функций для вашего классификатора состоит в том, чтобы ранжировать их в соответствии с критерием (таким как получение информации), а затем рассчитать точность, используя ваш классификатор и подмножество ранжированных функций. Например, если у вас...

10
Как сравнить производительность методов выбора функций?

Существует несколько подходов выбора функций / выбора переменных (см., Например, Guyon & Elisseeff, 2003 ; Liu et al., 2010 ): методы фильтрации (например, на основе корреляции, на основе энтропии, на основе важности случайных лесов), методы обертки (например, поиск вперед, поиск восхождения на...

10
Что делать, если данные тестирования имеют меньше возможностей, чем данные обучения?

Допустим, мы прогнозируем продажи магазина, и мои данные обучения имеют два набора функций: Один о продаже магазина с датами (поле «Магазин» не является уникальным) Один из типов магазинов (поле «Магазин» здесь уникально) Таким образом, матрица будет выглядеть примерно так:...

10
Можно ли использовать координаты GPS (широту и долготу) в качестве элементов в линейной модели?

У меня есть наборы данных, которые содержат, среди многих функций, GPS-координаты (широта и долгота). Я хотел бы использовать эти наборы данных для изучения таких проблем, как: (1) вычисление ETA для перехода между начальной и конечной точками; и (2) оценка количества преступлений по конкретной...

10
Линейная регрессия и масштабирование данных

На следующем графике показаны коэффициенты, полученные с помощью линейной регрессии ( mpgв качестве целевой переменной и всех других в качестве предикторов). Для набора данных mtcars ( здесь и здесь ) как с масштабированием данных, так и без него: Как мне интерпретировать эти результаты? Переменные...

10
Лучшие языки для научных вычислений [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 5 лет назад . Похоже, что большинство языков имеют некоторое...

9
Важность функции через случайный лес и линейную регрессию различны

Применил Лассо для ранжирования функций и получил следующие результаты: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Обратите внимание, что набор данных имеет 3 метки. Ранжирование функций для разных ярлыков одинаково....

9
Выбор функции для опорных векторных машин

Мой вопрос в три раза В контексте «Kernelized» поддержка векторных машин Желателен ли выбор переменной / функции - тем более, что мы упорядочиваем параметр C, чтобы предотвратить переоснащение, и основной причиной внедрения ядер в SVM является увеличение размерности проблемы, в таком случае...

9
Кодирование обучающего сигнала

У меня есть большое количество выборок, которые представляют битовые потоки, закодированные в Манчестере, в виде аудиосигналов. Частота, на которой они кодируются, является основной составляющей частоты, когда она высокая, и на заднем плане присутствует постоянный уровень белого шума. Я вручную...