В частности, я ищу ссылки (документы, книги), которые будут строго показывать и объяснять проклятие размерности. Этот вопрос возник после того, как я начал читать эту белую бумагу по Лафферти и Вассермана. В третьем абзаце упоминается «хорошо известное» уравнение, из которого следует, что наилучшая скорость сходимости равна ; если кто-то может объяснить это (и объяснить), это было бы очень полезно.
Кроме того, кто-нибудь может указать мне ссылку, которая выводит "хорошо известное" уравнение?
Ответы:
В продолжение richiemorrisroe, вот соответствующее изображение из Элементы статистического обучения , глава 2 (стр. 22-27):
Как видно из верхней правой панели, больше соседей на 1 единицу в 1 измерении больше, чем соседей на 1 единицу в 2 измерениях. 3 размеры были бы еще хуже!
источник
Это не дает прямого ответа на ваш вопрос, но у Дэвида Донохо есть хорошая статья об анализе многомерных данных: проклятия и благословения размерности (связанные слайды здесь ), в которой он упоминает три проклятия:
источник
Я знаю, что продолжаю ссылаться на это, но есть отличное объяснение этому - Элементы Статистического Обучения , глава 2 (стр. 22-27). Они в основном отмечают, что по мере увеличения измерений объем данных должен увеличиваться (экспоненциально) вместе с ним, или не будет достаточно точек в большем пространстве выборки для проведения любого полезного анализа.
В качестве источника они ссылаются на статью Беллмана (1961), которая, по-видимому, является его книгой «Адаптивные процессы управления», доступной на Amazon здесь.
источник
Возможно, наиболее печально известное влияние охватывается следующим пределом (который (косвенно) показан на рисунке выше):
Влияние размерности на данные в картинках
источник