В каких ситуациях мы должны использовать t-SNE (кроме визуализации данных)?
T-SNE используется для уменьшения размерности. Ответ на этот вопрос предполагает, что t-SNE следует использовать только для визуализации, и что мы не должны использовать его для кластеризации. Тогда какая польза от t-SNE?
Ответы:
Я не согласен с этим выводом. Нет оснований предполагать, что t-SNE универсально хуже любого другого алгоритма кластеризации. Каждый алгоритм кластеризации делает предположения о структуре данных, и можно ожидать, что они будут работать по-разному в зависимости от базового распределения и конечного использования уменьшенной размерности.
t-SNE, как и многие неконтролируемые алгоритмы обучения, часто предоставляют средства для достижения цели, например, получение раннего представления о том, являются ли данные разделимыми, проверка их наличия некоторой идентифицируемой структуры и проверка характера этой структуры. Не нужно визуализировать вывод t-SNE, чтобы начать отвечать на некоторые из этих вопросов. Другие применения вложений меньшего размера включают в себя функции построения для классификации или избавления от мультиколлинеарности для повышения эффективности методов прогнозирования.
источник