Что такое коллектор?

29

В технике уменьшения размерности, такой как анализ главных компонентов, LDA и т. Д., Часто используется термин «многообразие». Что такое многообразие в нетехническом термине? Если точка принадлежит сфере, размер которой я хочу уменьшить, и если есть шум y, а x и y некоррелированы, то фактические точки x будут далеко отделены друг от друга из-за шума. Следовательно, шумовая фильтрация будет необходима. Таким образом, уменьшение размера будет выполнено для z = x + y . Следовательно, где x и y принадлежат разным многообразиям?xyxyxz=x+yxy

Я работаю с данными облака точек, которые часто используются в видении роботов; облака точек шумят из-за шума при съемке, и мне нужно уменьшить шум перед уменьшением размеров. В противном случае я получу неправильное уменьшение размера. Итак, что такое многообразие здесь и является ли шум частью того же многообразия, к которому принадлежит ?x

Риа Джордж
источник
5
На самом деле невозможно правильно использовать этот термин, не будучи математически точным
Chill2Macht

Ответы:

45

В нетехнических терминах коллектор - это непрерывная геометрическая структура, имеющая конечное измерение: прямая, кривая, плоскость, поверхность, сфера, шар, цилиндр, тор, «капля» ... что-то вроде этого : введите описание изображения здесь

Это общий термин, используемый математиками, чтобы сказать «кривая» (измерение 1) или «поверхность» (измерение 2), или трехмерный объект (измерение 3) ... для любого возможного конечного измерения . Одномерное многообразие - это просто кривая (линия, круг ...). Двумерное многообразие - это просто поверхность (плоскость, сфера, тор, цилиндр ...). Трехмерное многообразие - это «полный объект» (шар, полный куб, трехмерное пространство вокруг нас ...).n

Многообразие часто описывается уравнением: множество точек таких как x 2 + y 2 = 1, является одномерным многообразием (круг).(x,y)x2+y2=1

Многообразие везде одинаково. Например, если вы добавляете линию (измерение 1) к сфере (измерение 2), то получающаяся геометрическая структура не является многообразием.

В отличие от более общих понятий метрического пространства или топологического пространства, также предназначенных для описания нашей естественной интуиции непрерывного набора точек, многообразие предназначено для того, чтобы быть чем-то локально простым: подобно векторному пространству конечной размерности: . Это исключает абстрактные пространства (например, бесконечные пространства измерений), которые часто не имеют геометрического конкретного значения.Rn

В отличие от векторного пространства, многообразия могут иметь различные формы. Некоторые многообразия можно легко визуализировать (сфера, шар ...), некоторые трудно визуализировать, например, бутылку Клейна или реальную проективную плоскость .

В статистике, машинном обучении или прикладной математике в целом слово «многообразие» часто используется для обозначения «как линейное подпространство», но, возможно, изогнутое. Каждый раз, когда вы пишете линейное уравнение, например: вы получаете линейное (аффинное) подпространство (здесь плоскость). Обычно, когда уравнение нелинейно, как3x+2y4z=1x2+2y2+3z2=7

Например, « гипотеза многообразияx2+y2=1https://i.stack.imgur.com/iEm2m.png

Бенуа Санчес
источник
4
@RiaGeorge На картинке это поверхность, которая является коллектором. Он непрерывный, потому что вы можете свободно перемещаться по нему без перерыва, и вам никогда не придется прыгать с поверхности, чтобы попасть между двумя местами. Отверстия, на которые вы ссылаетесь, важны для описания того, как вы можете перемещаться по поверхности между любыми двумя точками самым простым способом, и подсчет их является важной техникой при изучении многообразий.
Мэтью Друри,
4
Объяснение топологии было бы слишком широким вопросом для этого сайта, и немного не по теме. Я хотел бы найти информацию об этом на бирже стека математики. Многообразия и топология не являются синонимами: многообразия - это математические объекты, изучаемые с использованием методов топологии, топология - это предмет математики.
Мэтью Друри,
1
В ответе пропущены все основные моменты, которые делают коллектор таким, я не понимаю, как у него так много голосов. Топология, диаграмма и гладкость даже не упоминаются , и ответ в основном дает впечатление , что многообразие является поверхностью, которой не .
gented
2
С технической точки зрения множество решений системы уравнений не обязательно должно быть многообразием. Это разнообразие, так что это в основном многообразие, но оно может иметь точки самопересечения, где свойство многообразия не срабатывает.
Мэтт Сэмюэль
1
Ваше определение многообразия включает в себя требование конечной размерности . Но вы включаете примеры, которые не соответствуют этому требованию, такие как линии, плоскости, кривые и поверхности. Не могли бы вы уточнить, что вы имели в виду?
Маузер
13

M

Rnn

nci:MRc:MRn

RNNn

Обратите внимание, что для того, чтобы сделать «структуру» точной, необходимо понимать основные понятия топологии ( определение ), что позволяет составлять точные понятия «локального» поведения и, следовательно, «локально» выше. Когда я говорю «эквивалентный», я имею в виду эквивалентную топологическую структуру ( гомеоморфную ), а когда я говорю «сохраняющий структуру», я имею в виду то же самое (создает эквивалентную топологическую структуру).

Также обратите внимание, что для того, чтобы выполнить исчисление на многообразиях , нужно дополнительное условие, которое не следует из двух вышеупомянутых условий, которое в основном говорит что-то вроде «диаграммы достаточно хорошо ведут себя, чтобы позволить нам делать исчисление». Это коллекторы, наиболее часто используемые на практике. В отличие от общих топологических многообразий , в дополнение к исчислению они также допускают триангуляции , что очень важно в таких приложениях, как ваше, использующих данные облака точек .

Обратите внимание, что не все люди используют одно и то же определение для (топологического) многообразия. Некоторые авторы определят его как удовлетворяющее только условию (1) выше, необязательно также (2). Однако определение, которое удовлетворяет как (1), так и (2), ведет себя гораздо лучше, поэтому оно более полезно для практиков. Можно интуитивно ожидать, что (1) подразумевает (2), но на самом деле это не так.

Rn

Chill2Macht
источник
Спасибо за ваш ответ: Не могли бы вы объяснить, что такое топология и в нетехническом выражении? Терминология и многообразие используются взаимозаменяемо? Должно ли измерение быть целым числом? Что это реальное число, то я думаю, что структура известна как фракталы, если вся структура состоит из каждой части является самовоспроизводящейся.
Риа Джордж
1
n1N
@RiaGeorge Аксиомы для «топологии» можно найти на странице Википедии: en.wikipedia.org/wiki/General_topology#A_topology_on_a_set - обратите внимание также, что ссылка, которую я дал вам для (эквивалентного) определения «топологии» в терминах of соседство указывало на что-то связанное, но не одно и то же, я отредактировал свой ответ, чтобы отразить это: en.wikipedia.org/wiki/… Заметьте, однако, что определение в терминах окрестностей труднее понять (я думаю, я мог бы понять это хорошо, но я не беспокоюсь, потому что я ленивый
Chill2Macht
так что в любом случае это мое личное предвзятое мнение, что вам не нужно знать определение топологии соседства - просто знайте, что более простое определение дает вам все те же возможности определения окрестности в терминах строгого описания локального поведения, так как они эквивалент). В любом случае, если вас интересуют фракталы, возможно, вы найдете эти страницы Википедии интересными - хотя я не могу вам помочь с этим больше, потому что я не очень хорошо знаком с теорией и не знаю или не понимаю большую часть определения - я слышал только о некоторых из
Chill2Macht
1
Пока это единственный ответ, который обращает внимание на современную математическую идею сборки глобального объекта из локальных данных. К сожалению, это не совсем до уровня простоты и ясности, требуемого от «нетехнического» счета.
whuber
10

В этом контексте термин «многообразие» является точным, но неоправданно высоким содержанием флютина. Технически, многообразие - это любое пространство (множество точек с топологией), которое является достаточно гладким и непрерывным (таким образом, что, с некоторым усилием, можно сделать математически правильно определенным).

Представьте себе пространство всех возможных значений ваших исходных факторов. После техники уменьшения размеров не все точки в этом пространстве достижимы. Вместо этого будут доступны только точки на некотором встроенном подпространстве внутри этого пространства. Это вложенное подпространство соответствует математическому определению многообразия. Для техники линейного уменьшения размеров, такой как PCA, это подпространство является просто линейным подпространством (например, гиперплоскостью), которое является относительно тривиальным многообразием. Но для техники нелинейного уменьшения размеров это подпространство может быть более сложным (например, изогнутая гиперповерхность). Для анализа данных понимание того, что это подпространства, гораздо важнее любого вывода, который вы могли бы сделать, зная, что они удовлетворяют определению многообразия.

Дэвид Райт
источник
4
«Хайфалутин» ... выучил новое слово сегодня!
Мердад
5
Математически, многообразием является любое локально непрерывное топологическое пространство. Мне нравится идея пытаться объяснить вещи простым языком, но эта характеристика действительно не работает. Прежде всего, непрерывность всегда является локальной собственностью, поэтому я не уверен, что вы подразумеваете под локально непрерывной. Кроме того, ваше определение не исключает многих вещей, которые не являются многообразиями, таких как рациональная числовая линия или объединение двух пересекающихся линий на евклидовой плоскости.
Бен Кроуэлл,
4
Я согласен с Беном, технически это "локально евклидово". Я не уверен, что есть хороший способ свести это к простому английскому языку.
Мэтью Друри,
1
Я также должен полностью согласиться с двумя комментариями выше. Фактически, ответ, который я написал ниже, первоначально должен был стать поясняющим комментарием к этому ответу, который стал слишком длинным. Не существует точного понятия «непрерывного» топологического пространства (см. Здесь: math.stackexchange.com/questions/1822769/… ). Определение многообразий в терминах несуществующих понятий, на мой взгляд, в долгосрочной перспективе скорее сбивает с толку, чем уточняет. По крайней мере, я бы предложил заменить слово «математически» в первом предложении чем-то другим.
Chill2Macht
Я буду использовать этот комментарий как возможность задать небольшой вопрос ... Мне кажется, я получил представление о многообразиях, но зачем он нужен "локально"? Разве пространство не "локально" непрерывно ... непрерывно в целом?
Paul92