Лемма Джонсона-Линденштраусса позволяет представлять точки в многомерном пространстве в точки в более низком измерении. При нахождении низкоразмерных пространств наилучшего соответствия стандартная методика заключается в том, чтобы найти разложение по сингулярному значению и затем взять подпространство, порожденное наибольшим сингулярным значением. Когда интересно использовать Джонсона-Линденштраусса над СВД?
источник
SVD и JL также экстраполируют на будущие точки также по-разному.
То есть, если вы предполагаете, что ваши данные поступают из некоторого базового распределения, в принципе SVD должен оставаться «хорошим» для любых будущих точек, пока они отбираются из одного и того же распределения. С другой стороны, целевое измерение JL зависит от количества точек, а это означает, что применение преобразования JL к дополнительным точкам может увеличить вероятность ошибки.
Это становится актуальным, если, например, если вы используете уменьшение размерности в качестве шага предварительной обработки для какого-либо другого алгоритма. Границы SVD для тренировочных данных могут сохраняться на тестовых данных, но JL не будет.
источник
Это продолжение ответа Суреша - я немного погуглил после прочтения его ответа и пришел к следующему пониманию. Первоначально я собирался опубликовать это как комментарий к его ответу, но он продолжал расти.
Пожалуйста, укажите на ошибки в ответе, я не специалист в этой области.
В некотором смысле, JL и SVD похожи на яблоки и апельсины.
1) Проблемы, которые они решают, совершенно разные. Один касается парных расстояний, другой - с наилучшим представлением. Один наихудший случай, другой средний случай.
(Это не точно, я прокомментирую это позже)
Проблема, которую решает SVD: (задано измерение ) arg min P из dim k { Avg ( | | u - P u | | 2 ) }k
2) Входные данные: хотя оба алгоритма выводят подпространства, необходимые им входные данные различны. Для JL требуется допуск (какова максимальная ошибка, которую вы готовы допустить между фактическими расстояниями и расстояниями в подпространстве), в то время как SVD требует количества измерений.ϵ
3) JL неконструктивен, SVD конструктивен - этот момент немного расплывчатый, так как термин конструктивный точно не определен. Существуют детерминированные алгоритмы для вычисления SVD, но алгоритм поиска пространства JL является рандомизированным - делайте случайные проекции, если не получится, попробуйте еще раз.4) SVD является уникальным (подпространство может быть не уникальным, но целевое значение будет одинаковым для всех подпространств). Уравнение (1) выше, не является точным в том смысле , что JL не на самом деле говорить о минимизации расхождения в попарных расстояниях - это дает гарантию о существовании меньшего подпространства , где расстояние будет atmost отличается от их фактического ценности. Таких подпространств может быть много, некоторые лучше, чем другие.ϵ
(См. Комментарии для объяснения по поводу вычеркнутых частей ответа).
Изменить: @ john-myles-white написал сообщение о JL, чтобы проверить свои претензии и показать, как можно построить проекцию: http://www.johnmyleswhite.com/notebook/2014/03/24/a-note- на-джонсон-Линденштраусс-лемма /
источник