Как рассчитать количество функций на основе разрешения изображения?

18

Просто покрыта нелинейная Гипотеза Эндрю Нг из Neural Netowrks, и у нас был вопрос множественного выбора для определения количества функций для изображения разрешения 100x100 из grescale интенсивности.

И ответ был 50 миллионов, $5$ х $10^7$

Тем не менее, ранее для 50 х 50 пикселей, серого изображения. количество функций 50х50 (2500)

Почему бы это было $5$ х $10^7$ вместо $10,000$ ?

Тем не менее, он говорит, что включает все квадратичные термины ( $x_ix_j$ ) в качестве признаков

Предположим, вы учитесь распознавать автомобили по 100 × 100 пиксельным изображениям (оттенки серого, а не RGB). Пусть объекты будут значениями интенсивности пикселей. Если вы обучите логистическую регрессию, включающую в себя все квадратичные термины ( $x_ix_j$ ), как функции, сколько у вас будет функций?

и на предыдущем слайде, касающемся 100x100, квадратичные элементы ( $x_i$ x $x_j$ ) = 3 миллиона элементов, но я все еще не могу указать на соединение.

feature-selection image-processing Iancovici
источник

16

Возможно, более простой случай прояснит ситуацию. Допустим, мы выбрали образец пикселей 1х2 вместо 100х100.

Образцы пикселей с изображения

+----+----+
| x1 | x2 |
+----+----+

Представьте, что при построении нашего обучающего набора мы заметили, что его нельзя легко разделить линейной моделью, поэтому мы решили добавить полиномиальные термины, чтобы лучше соответствовать данным.

Допустим, мы решили построить наши многочлены, включив все интенсивности пикселей и все возможные кратные, которые могут быть сформированы из них.

Поскольку наша матрица мала, давайте перечислим их:

x_{1}, x_{2}, x_{1}^{2}, x_{2}^{2}, x_{1} \times x_{2}, x_{2} \times x_{1}

$x_1,\ x_2,\ x_1^2,\ x_2^2,\ x_1 \times x_2,\ x_2 \times x_1$

Интерпретируя приведенную выше последовательность функций, можно увидеть, что существует закономерность. Первые два слагаемых, группа 1, являются признаками, состоящими только из интенсивности их пикселей. Следующие два термина после этого, группа 2, являются признаками, состоящими из квадрата их интенсивности. Последние два члена, группа 3, являются произведением всех комбинаций парных (двух) интенсивностей пикселей.

группа 1: $x_1,\ x_2$

группа 2: $x_1^2,\ x_2^2$

группа 3: $x_1 \times x_2,\ x_2 \times x_1$

Но подождите, есть проблема. Если вы посмотрите на члены группы 3 в последовательности ( и ), вы заметите, что они равны. Помните наш пример жилья. Представьте, что для одного и того же дома есть две функции: х1 = квадратная метра и х2 = квадратная метра ... Это не имеет никакого смысла! Итак, нам нужно избавиться от дубликата, скажем, произвольно . Теперь мы можем переписать список функций группы три как: $x_1 \times x_2$ $x_2 \times x_1$ $x_2 \times x_1$

группа 3: $x_1 \times x_2$

Мы считаем функции во всех трех группах и получаем 5.

Но это игрушечный пример. Получим общую формулу для расчета количества объектов. Давайте использовать наши оригинальные группы функций в качестве отправной точки.

$size group 1 + size group 2 + size group 3 = m \times n + m \times n +m \times n = 3 \times m \times n$

Ах! Но нам пришлось избавиться от дубликата товара в группе 3.

Поэтому для правильного подсчета функций для группы 3 нам потребуется способ подсчета всех уникальных парных продуктов в матрице. Что можно сделать с помощью биномиального коэффициента, который является методом подсчета всех возможных уникальных подгрупп размера k из равной или большей группы размера n. Поэтому для правильного подсчета объектов в группе 3 рассчитайте . $C(m \times n, 2)$

Таким образом, наша общая формула будет:

m \times n + m \times n + C (m \times n, 2) = 2 m \times n + C (m \times n, 2)

$m \times n + m \times n +C(m \times n, 2) = 2m \times n + C(m \times n, 2)$

Давайте использовать его для вычисления количества функций в нашем примере с игрушкой:

2 \times 1 \times 2 + C (1 \times 2, 2) = 4 + 1 = 5

$2 \times 1 \times 2 + C(1 \times 2, 2) = 4 + 1 = 5$

Это оно!

Анвар А. Рафф
источник

2

Жаль, что это объяснение не было дано в лекции!

Ян Уокер-Спербер

Мне интересно, как мы узнали об этом в курсе без объяснения

причин

6

Если вы используете все линейные и квадратичные функции, общее число должно быть:

100*100 + 100*100 + C(100*100,2) = 50015000
10000   + 10000   + 49995000     = 50015000
xi         xi^2       xixj

lennon310
источник

1

Можете ли вы объяснить это немного дальше? ты говоришь xi + xi ^ 2 + xixi? Является ли xi = 100 и xj = 100? почему xi и xi ^ 2 оба равны 100 * 100? Что такое С (100 * 100,2)?

Янцовичи

4

(1) всего 100 * 100 пикселей, если вы используете интенсивность в качестве объектов, всего будет 100 * 100 объектов, то есть XI; и (ii) вы также можете использовать плотность мощности в качестве функции, то есть (xi, xi) или xi. ^ 2, в сумме 100 * 100; наконец (iii) если вы используете корреляции между двумя пикселями, всего будет C пар пикселей, то есть (xi, xj), C - комбинация по математике ( mathworld.wolfram.com/Combination.html )

lennon310

Спасибо, последний вопрос: почему xi = xi ^ 2 в этом контексте?

Янцовичи

Я использовал xi для представления одного пикселя, а xi ^ 2 означает использование пар одного и того же пикселя (xi, xi). Количество отдельных пикселей одинаково для пар одного и того же пикселя. Это никак не связано с интенсивностью пикселей. Извините за путаницу.

lennon310

Тот же вопрос, несколько лет спустя. Разве мы не должны учитывать также возможные значения интенсивности (от 0 до 255)?

albus_c

0

$x^2$

Опетунде Адепою
источник

2

2500^{2} / 2 \approx 3

$2500^2/2 \approx 3$

50

$50$

0

@whuber 50 миллионов приходит, когда у вас есть изображение размером 100 * 100 пикселей. где квадрат (100 * 100) = 100000000 (10 миллионов) и квадрат (100 * 100) / 2 = 5 миллионов. Надеюсь, что это ответы.

Тахир Ахмад
источник

Это ответ на комментарий, а не ответ на этот вопрос.

Майкл Р. Черник

Как рассчитать количество функций на основе разрешения изображения?

Ответы: