Что означает «инвариант перестановки» в контексте нейронных сетей, выполняющих распознавание изображений?

Ответы:

17

В этом контексте это относится к тому факту, что модель не предполагает пространственных отношений между объектами. Например, для многослойного персептрона вы можете переставлять пиксели, и производительность будет одинаковой. Это не относится к сверточным сетям, которые предполагают отношения соседства.

bayerj
источник
1
да, это запутанная часть Разве это не должно быть пространственные отношения в классификации цифр?
RockTheStar
1
MNIST широко используется в качестве эталона (или проверки работоспособности) в нейронных сетях. Если ваша модель может получить ошибку <1% в MNIST, инвариантном по перестановке, вы к чему-то подходите.
Bayerj
1
Да, я имею в виду, не существует ли пространственная связь цифрами? Если вы переставите цифры пикселей, это изменит порядок пикселей, что существенно повлияет на производительность !?
RockTheStar
1
Только если модель предполагает это. mlps не делает, коннет делает. Вот почему сравнивать коннет с mlp на mnist несколько несправедливо.
Bayerj
1
Я вижу! Итак, в наборе данных mnist, mlps работает лучше или convnet?
RockTheStar
6

fx=(x1,,xn)fxn=3

f((x1,x2,x3))=f((x2,x1,x3))=f((x3,x1,x2))
and so on.
kjetil b halvorsen
источник
1
This answer is a little misleading, because the in machine learning the learning algorithm is often permutation invariant, while the function it returns is not.
bayerj
@bayerj: Это интересная информация, но я не могу понять, что это определение, которое я дал, вводит в заблуждение , это правильное определение, но, возможно, не полный ответ в этом контексте.
kjetil b halvorsen
Вы правы, определение верное. Но это не относится к тому, как вы это записываете. В контексте инварианта MNIST о перестановке, о котором спрашивал OP, функции записанной вами формы не выполняются.
Bayerj