В технике уменьшения размерности, такой как анализ главных компонентов, LDA и т. Д., Часто используется термин «многообразие». Что такое многообразие в нетехническом термине? Если точка принадлежит сфере, размер которой я хочу уменьшить, и если есть шум y, а x и y некоррелированы, то фактические точки x будут далеко отделены друг от друга из-за шума. Следовательно, шумовая фильтрация будет необходима. Таким образом, уменьшение размера будет выполнено для z = x + y . Следовательно, где x и y принадлежат разным многообразиям?
Я работаю с данными облака точек, которые часто используются в видении роботов; облака точек шумят из-за шума при съемке, и мне нужно уменьшить шум перед уменьшением размеров. В противном случае я получу неправильное уменьшение размера. Итак, что такое многообразие здесь и является ли шум частью того же многообразия, к которому принадлежит ?
источник
Ответы:
В нетехнических терминах коллектор - это непрерывная геометрическая структура, имеющая конечное измерение: прямая, кривая, плоскость, поверхность, сфера, шар, цилиндр, тор, «капля» ... что-то вроде этого :
Это общий термин, используемый математиками, чтобы сказать «кривая» (измерение 1) или «поверхность» (измерение 2), или трехмерный объект (измерение 3) ... для любого возможного конечного измерения . Одномерное многообразие - это просто кривая (линия, круг ...). Двумерное многообразие - это просто поверхность (плоскость, сфера, тор, цилиндр ...). Трехмерное многообразие - это «полный объект» (шар, полный куб, трехмерное пространство вокруг нас ...).N
Многообразие часто описывается уравнением: множество точек таких как x 2 + y 2 = 1, является одномерным многообразием (круг).( х , у) Икс2+ у2= 1
Многообразие везде одинаково. Например, если вы добавляете линию (измерение 1) к сфере (измерение 2), то получающаяся геометрическая структура не является многообразием.
В отличие от более общих понятий метрического пространства или топологического пространства, также предназначенных для описания нашей естественной интуиции непрерывного набора точек, многообразие предназначено для того, чтобы быть чем-то локально простым: подобно векторному пространству конечной размерности: . Это исключает абстрактные пространства (например, бесконечные пространства измерений), которые часто не имеют геометрического конкретного значения.Rn
В отличие от векторного пространства, многообразия могут иметь различные формы. Некоторые многообразия можно легко визуализировать (сфера, шар ...), некоторые трудно визуализировать, например, бутылку Клейна или реальную проективную плоскость .
В статистике, машинном обучении или прикладной математике в целом слово «многообразие» часто используется для обозначения «как линейное подпространство», но, возможно, изогнутое. Каждый раз, когда вы пишете линейное уравнение, например: вы получаете линейное (аффинное) подпространство (здесь плоскость). Обычно, когда уравнение нелинейно, как3x+2y−4z=1 x2+2y2+3z2=7
Например, « гипотеза многообразияx2+y2=1
источник
Обратите внимание, что для того, чтобы сделать «структуру» точной, необходимо понимать основные понятия топологии ( определение ), что позволяет составлять точные понятия «локального» поведения и, следовательно, «локально» выше. Когда я говорю «эквивалентный», я имею в виду эквивалентную топологическую структуру ( гомеоморфную ), а когда я говорю «сохраняющий структуру», я имею в виду то же самое (создает эквивалентную топологическую структуру).
Также обратите внимание, что для того, чтобы выполнить исчисление на многообразиях , нужно дополнительное условие, которое не следует из двух вышеупомянутых условий, которое в основном говорит что-то вроде «диаграммы достаточно хорошо ведут себя, чтобы позволить нам делать исчисление». Это коллекторы, наиболее часто используемые на практике. В отличие от общих топологических многообразий , в дополнение к исчислению они также допускают триангуляции , что очень важно в таких приложениях, как ваше, использующих данные облака точек .
Обратите внимание, что не все люди используют одно и то же определение для (топологического) многообразия. Некоторые авторы определят его как удовлетворяющее только условию (1) выше, необязательно также (2). Однако определение, которое удовлетворяет как (1), так и (2), ведет себя гораздо лучше, поэтому оно более полезно для практиков. Можно интуитивно ожидать, что (1) подразумевает (2), но на самом деле это не так.
источник
В этом контексте термин «многообразие» является точным, но неоправданно высоким содержанием флютина. Технически, многообразие - это любое пространство (множество точек с топологией), которое является достаточно гладким и непрерывным (таким образом, что, с некоторым усилием, можно сделать математически правильно определенным).
Представьте себе пространство всех возможных значений ваших исходных факторов. После техники уменьшения размеров не все точки в этом пространстве достижимы. Вместо этого будут доступны только точки на некотором встроенном подпространстве внутри этого пространства. Это вложенное подпространство соответствует математическому определению многообразия. Для техники линейного уменьшения размеров, такой как PCA, это подпространство является просто линейным подпространством (например, гиперплоскостью), которое является относительно тривиальным многообразием. Но для техники нелинейного уменьшения размеров это подпространство может быть более сложным (например, изогнутая гиперповерхность). Для анализа данных понимание того, что это подпространства, гораздо важнее любого вывода, который вы могли бы сделать, зная, что они удовлетворяют определению многообразия.
источник