Вопросы с тегом «image-processing»

Форма обработки сигнала, при которой на входе является изображение. Обычно цифровое изображение рассматривается как двумерный сигнал (или многомерный). Эта обработка может включать восстановление и улучшение изображения (в частности, распознавание образов и проецирование).

110
Обнаружение данного лица в базе данных изображений лица

Я работаю над небольшим проектом с участием лиц пользователей твиттера через их фотографии в профиле. Проблема, с которой я столкнулся, заключается в том, что после того, как я отфильтрую все, кроме изображений, которые являются четкими портретными фотографиями, небольшой, но значительный процент...

88
Зачем нормализовывать изображения, вычитая среднее значение изображения набора данных вместо текущего среднего значения изображения в глубоком обучении?

Существуют некоторые варианты нормализации изображений, но большинство, похоже, используют эти два метода: Вычтите среднее значение для канала, рассчитанное для всех изображений (например, VGG_ILSVRC_16_layers ) Вычесть по пикселю / каналу, рассчитанному по всем изображениям (например, CNN_S ,...

73
Как простая модель логистической регрессии достигает 92% точности классификации по MNIST?

Несмотря на то, что все изображения в наборе данных MNIST центрированы с одинаковым масштабом и обращены вверх без поворотов, у них есть существенный разброс рукописного текста, который удивляет меня, как линейная модель достигает такой высокой точности классификации. Насколько я могу...

60
В чем разница между отбеливанием ZCA и отбеливанием PCA?

Меня смущает отбеливание ZCA и нормальное отбеливание (которое получается путем деления главных компонентов на квадратные корни собственных значений PCA). Насколько мне известно, xZCAwhite=UxPCAwhite,xZCAwhite=UxPCAwhite,\mathbf x_\mathrm{ZCAwhite} = \mathbf U \mathbf x_\mathrm{PCAwhite}, где -...

38
ImageNet: что такое топ-1 и топ-5 ошибок?

В классификационных документах ImageNet показатели ошибок топ-1 и топ-5 являются важными единицами измерения успешности некоторых решений, но каковы эти коэффициенты ошибок? В классификации ImageNet с глубокими сверточными нейронными сетями Крижевский и соавт. каждое решение, основанное на одной...

33
Как наиболее точно определить цвет объекта?

Я написал компьютерную программу, которая может обнаруживать монеты в статическом изображении (.jpeg, .png и т. Д.), Используя некоторые стандартные методы для компьютерного зрения (размытие по Гауссу, определение порога, преобразование Хафа и т. Д.). Используя соотношения монет, взятых из данного...

33
Как оценить сходство двух гистограмм?

Учитывая две гистограммы, как мы оцениваем, похожи они или нет? Достаточно ли просто посмотреть на две гистограммы? Простое сопоставление один к одному имеет проблему, заключающуюся в том, что если гистограмма немного отличается и немного смещается, то мы не получим желаемый результат. Какие-либо...

25
Как нейронная сеть распознает изображения?

Этот вопрос был перенесен из переполнения стека, потому что на него можно ответить по перекрестной проверке. Мигрировал 7 лет назад . Я пытаюсь узнать, как работает нейронная сеть по распознаванию изображений. Я видел несколько примеров и стал еще более запутанным. В примере распознавания букв для...

23
Влияет ли формат изображения (png, jpg, gif) на обучение нейронной сети распознавания изображений?

Я знаю, что было много достижений в отношении распознавания изображений, классификации изображений и т. Д. С глубокими, сверточными нейронными сетями. Но если я обучу сеть, скажем, PNG-изображениям, будет ли она работать только для изображений, закодированных таким образом? Какие другие свойства...

22
Энтропия изображения

Каков наиболее информационно-физически-теоретический правильный способ вычисления энтропии изображения? Сейчас меня не волнует эффективность вычислений - я хочу, чтобы теоретически это было как можно более корректно. Давайте начнем с серого изображения. Одним из интуитивных подходов является...

18
Как рассчитать количество функций на основе разрешения изображения?

Просто покрыта нелинейная Гипотеза Эндрю Нг из Neural Netowrks, и у нас был вопрос множественного выбора для определения количества функций для изображения разрешения 100x100 из grescale интенсивности. И ответ был 50 миллионов, 555 х 10710710^7 Тем не менее, ранее для 50 х 50 пикселей, серого...

18
Сравнение двух гистограмм с использованием расстояния хи-квадрат

Я хочу сравнить два изображения лиц. Я рассчитал их LBP-гистограммы. Итак, теперь мне нужно сравнить эти две гистограммы и получить что-то, что скажет, насколько эти гистограммы равны (0 - 100%). Существует много способов решения этой задачи, но авторы метода LBP подчеркивают (Face Face with Local...

18
Каковы различия между алгоритмом Баум-Уэлча и тренировкой Витерби?

В настоящее время я использую тренировку Витерби для проблемы сегментации изображения. Я хотел знать, в чем преимущества / недостатки использования алгоритма Баума-Уэлча вместо тренировки Витерби....

16
Подготовка базового марковского случайного поля для классификации пикселей на изображении

Я пытаюсь научиться использовать случайные поля Маркова для сегментирования областей на изображении. Я не понимаю некоторые параметры в MRF или почему максимизация ожидания, которую я выполняю, иногда не сходится к решению. Исходя из теоремы Байеса, я имею , где y - значение серой шкалы пикселя, а...

14
Что означает слой узких мест в нейронных сетях?

Я читал документ FaceNet и в 3-м абзаце введения говорится: Предыдущие подходы к распознаванию лиц, основанные на глубоких сетях, используют уровень классификации, обученный на основе набора известных идентификаторов лиц, а затем используют промежуточный уровень узких мест в качестве представления,...

10
Обнаружение круговых структур в данных облака точек

Для какого-то алгоритма реконструкции объема, над которым я работаю, мне нужно обнаружить произвольное количество круговых паттернов в данных трехмерных точек (поступающих с устройства LIDAR). Образцы могут быть произвольно ориентированы в пространстве, и предполагается, что они лежат (хотя и не...

10
Функция потерь для семантической сегментации

Приносит свои извинения за неправильное использование технических терминов. Я работаю над проектом семантической сегментации с помощью сверточных нейронных сетей (CNN); пытаясь реализовать архитектуру типа Encoder-Decoder, поэтому размер вывода совпадает с размером ввода. Как вы оформляете...

10
Как автоматически кластеризовать U-Matrix?

После тренировки самоорганизующейся карты можно рассчитать U-матрицу . Существуют некоторые инструменты для ручной визуализации и идентификации кластеров, но мне интересно, есть ли какой-нибудь алгоритм для автоматического выполнения этого процесса (то есть, когда человек не смотрит на рисунок для...

9
Какая модель глубокого обучения может классифицировать категории, которые не являются взаимоисключающими

Примеры: у меня есть предложение в должностной инструкции: «Старший инженер Java в Великобритании». Я хочу использовать модель глубокого обучения, чтобы предсказать ее как 2 категории: English и IT jobs. Если я использую традиционную классификационную модель, она может предсказать только 1 метку с...