Я очень плохо знаком с встраиванием слов. Я хочу визуализировать, как документы выглядят после обучения. Я читал, что t-SNE - это подход к этому. У меня есть 100K документов с 250 размерами в качестве размера вложения. Также доступно несколько пакетов.
Однако, для t-SNE, я не знаю, сколько итераций, или значения альфа, или значения проницаемости, я должен сохранить, чтобы учиться лучше.
Это гиперпараметры или они могут быть определены некоторыми атрибутами?
источник
Я процитирую часто задаваемые вопросы от вебсайта t-SNE . Первый за недоумение:
Для всех других параметров я хотел бы прочитать это:
Другими словами это означает: посмотрите на график, если визуализация хорошая, не меняйте параметры. Вы также можете выбрать прогон с наименьшей дивергенцией KL для каждого фиксированного недоумения.
источник