Таблица 18.1 в Элементах статистического обучения суммирует эффективность нескольких классификаторов в наборе данных 14 классов. Я сравниваю новый алгоритм с лассо и эластичной сеткой для таких задач мультиклассовой классификации.
Используя glmnet
версию 1.5.3 (R 2.13.0), я не могу воспроизвести пункт 7. ( многочлен с пенизированным ) в таблице, где количество используемых генов составляет 269, а ошибка теста составляет 13 из 54. Используемые данные - это набор данных микрочипов с 14 раками . Что бы я ни пытался, я получаю модель с лучшими характеристиками, использующую 170-180 генов с ошибкой теста 16 из 54.
Обратите внимание, что в начале Раздела 18.3 на странице 654 описана некоторая предварительная обработка данных.
Я связался с авторами - пока без ответа - и спрашиваю, может ли кто-либо подтвердить, что существует проблема с воспроизведением таблицы, или предложить решение о том, как воспроизвести таблицу.
Ответы:
Вы проверили пакет R книги? он содержит все наборы данных, функции и большинство сценариев, используемых там ...
источник