На каких сайтах обмена фотографиями выставляются серийные номера камер?

26

Какие сайты выставляют серийные номера корпуса камеры из оригинального изображения EXIF?

Flickr - это веб-сайт для обмена фотографиями, который предоставляет множество метаданных фотографий (из данных EXIF ) и даже облегчает доступ к ним благодаря API Flickr . Picasaweb от Google также предлагает некоторую информацию из EXIF, но не серийный номер.

Есть ли другие сайты, которые могут мне помочь?

В качестве предыстории того, что я делаю, я пытаюсь сопоставить базу данных серийных номеров камер и URL-адресов изображений, где они были найдены. Это только я делаю что-то бесплатно в надежде, что мы сможем поймать людей, которые крадут наши драгоценные камеры! Я надеюсь, что это не слишком не по теме, потому что я не пытаюсь ничего продать, просто пытаюсь сделать что-то хорошее!

Отказ от ответственности: я автор украденных камерфиндер ;)


Обновление - по запросу fbuchinger, вот быстрое обновление статуса проекта:

Многие сайты (включая, к сожалению, Facebook) убирают подписи с EXIF. До сих пор я обнаружил, что самым богатым источником серийных номеров является Flickr. Я полагаю, это потому, что люди часто загружают полноразмерные (читай «неотредактированные») изображения. На моем сайте ( stolencamerafinder.com ) я предлагаю Java-приложение для веб-старта, которое собирает данные flickr через его API. Поскольку существует ограничение на скорость, с которой я выполняю вызовы API, я написал это так, чтобы работа распределялась между числом клиентов веб-запуска, таким образом, уменьшая пропускную способность и ЦП на клиентах, чем больше людей запускают его. Если вы читаете это и у вас есть, скажем, административный доступ к рабочему серверу, который мало что делает, почему бы не оставить его включенным там;)

Я также написал плагин для Google Chrome, который просто следит за изображениями на веб-сайтах со встроенным серийным номером. Я не ожидаю очень высокой доходности от этого приложения, основная идея состояла в том, чтобы выяснить, какие сайты могут быть хорошими источниками для написания сделанных на заказ инструментов для паутинга, а затем сканировать их.

Я опубликовал свой API для stolencamerafinder и ищу других программистов, которые помогут мне писать программы, которые могут служить поисковыми роботами.

В ходе этого проекта я собрал много интересных данных, которые скоро выложу на сайт, например, о том, какие модели камер делают и не пишут полезные серийные номера. Например, Nikon D50 просто пишет «D50» в качестве серийного номера!

Я был бы чрезвычайно признателен за любые отзывы (хорошие или плохие!), Которые вы можете получить о моем проекте.

Матф

Мэтт Бернс
источник
8
Возможно, более полезным и пригодным для продажи будет предложение услуги по отслеживанию того, где «ваши» фотографии были (повторно) использованы, возможно, без лицензии.
Роуланд Шоу
я обновил свой ответ
fbuchinger

Ответы:

6

Мне нравится идея ловца воров. ;)

Я заметил, что DeviantArt.com, кажется, «захватывает» все метаданные EXIF, которые встроены в любые загруженные изображения. Это не показывает все это, однако есть некоторые части сайта (многие из них только для платных участников), которые показывают более подробную информацию о загруженном изображении, и я видел полные данные тега в списке.

Я думаю, технически говоря, если бы вы могли сделать что-то похожее на TinEye.com (Reverse Image Search), который индексирует изображения и выполняет поиск по сходству контента. TinEye удобен тем, что сопоставляет изображения по содержанию, но имеет свои ограничения. Фотоманипуляции, созданные с помощью фото, защищенного авторским правом, трудно идентифицировать. Поиск по серийному номеру обеспечит альтернативный, бесплатный подход.

Технически вы можете получить любые exif-данные, встроенные в изображения, загруженные в Интернет. Если серийный номер камеры введен, у вас будет то, что вы ищете. Вам нужно будет собрать копию каждого изображения с сайтов, которые вы проиндексировали, извлечь любые EXIF ​​(или другие данные тега) из проиндексированных изображений и отследить информацию со ссылкой на источник. Возможно, вы также можете использовать основные поисковые системы, такие как Bing и Google, для поиска изображений для индексации (может быть достаточно базового поиска изображений по ключевым словам, таких как имена фотографов, местоположения и т. Д.) Вероятно, вам не нужно будет держать изображение рядом (и в любом случае это может повлечь за собой юридические проблемы), но, по крайней мере, у вас будет индекс данных тега EXIF ​​/ IPTC, возможно, серийный номер и ссылка на источник.

Йриста
источник
1
Один улов заключается в том, что если фото каким-либо образом манипулировать, EXIF ​​очень вероятно удаляется или уменьшается. Доступность EXIF-данных на сайте обмена фотографиями и общий поиск изображений полностью зависят от мета-содержимого загруженного изображения. Тем не менее, поиск мета-информации, которую можно использовать для поиска украденной камеры, сам по себе является хорошей идеей.
Ник
@nik: Правда, вы будете зависеть от того, что загружено ... Очень плохо, что рабочие процессы в большинстве инструментов, таких как Photoshop, Lightroom и т. д., не сохраняют данные тегов при сохранении и модификации.
Йриста
Спасибо за указание на tineye. Они имеют до 1,6 миллиарда изображений, из-за чего мои 0,3 миллиона выглядят просто мусором! Но если они могут сделать это, я тоже могу! Я приступлю к написанию более общего веб-сканера, который бы занимал все веб-сайты ...
Мэтт
@matt: правда, у них 1,6 миллиарда, но они не ищут по серийному номеру. Если бы вы могли осуществлять поиск по содержанию и серийному номеру, у вас было бы преимущество. ; P
Йриста
Обратите внимание, что на многих сайтах вы не можете получить доступ к исходному файлу, если у вас нет статуса участника или подключения к пользователю, который его загрузил. Таким образом, вы можете загружать только уменьшенную версию, в которой чаще всего используется EXIF. Инструменты загрузки иногда тоже делают это, отправляя файл только с информацией об авторских правах. Subnote: Facebook лишает все это, даже авторское право от EXIF ​​и получило много тепла от фотографов за это.
Итай
6

ОБНОВИТЬ:

Спасибо за обновление статуса проекта! Прежде всего интересен подход с приложением Java WebStart. Используете ли вы разные ключи API Flickr для каждого экземпляра WebStart, или Flickr ограничивает запросы API, основанные на комбинации ключа API / IP-адреса?

Я запустил ваше приложение веб-запуска, и после сканирования 50 фотографий было получено 0 серийных номеров. Я не смотрел на ваш исходный код, но вы должны знать, что только крошечное меньшинство камер (в основном dslrs) записывают серийные номера в метаданные exif.

Я бы порекомендовал загрузить образцы изображений из метаинформационного репозитория Фила Харви и запустить на нем exiftool, чтобы увидеть, какие модели действительно дают серийные номера. Затем вы можете сузить поиск приложений в веб-старте до этих моделей и тем самым значительно повысить коэффициент успеха.


Я наткнулся на ваш вопрос, когда только начал изучать photo.stackexchange.com.

2 года назад у меня была идея, очень похожая на stolencamerafinder, и я фактически начал реализовывать ее на python. Однако я остановил это по разным причинам:

  • Большинство серийных номеров камер, хранящихся в данных EXIF, доступны для редактирования и, следовательно, являются поддельными (по крайней мере, с помощью exiftool) -> риск ложных предупреждений или «спама с серийным номером» (по крайней мере, когда служба начинает становиться популярной)

  • Большинство людей используют загрузчики изображений, которые изменяют размер своих изображений и, таким образом, часто отбрасывают все или многие части данных EXIF ​​(помните, что серийный номер всегда хранится в некотором проприетарном exif makernote, который часто отбрасывается во время преобразования изображений) -> низкое соотношение проверенных изображений : извлеченные серийные номера.

однако мне любопытно, как развивался ваш проект ... не могли бы вы дать краткое резюме статуса?

fbuchinger
источник
Здравствуй. Я только что добавил обновление в основной вопрос выше. Если у вас есть какие-либо вопросы / предложения, я хотел бы услышать их. -Матт
горит
Я использую только один ключ API, но каждый экземпляр веб-запуска связывается через веб-сайт, чтобы сбалансировать нагрузку, чтобы квота не превышалась.
Мэтт горит
Меня беспокоит, почему приложение webstart не работает для вас. В сериалах должно быть около 1/4 отсканированных фотографий. Есть ли сообщения в журналах консоли Java? Я скачал эти примеры изображений и написал скрипт на python для генерации статистики. Я опубликую их в ближайшее время, так как другим может быть интересно.
Мэтт горит
6

Поскольку мой первый ответ более сфокусирован на технических деталях, я решил открыть второй ответ, чтобы дать вам краткий обзор моей первоначальной идеи «camerafinder», получившей название «CATT» (Camera Anti Theft Tool). Не стесняйтесь использовать мои идеи, но, пожалуйста, поверьте мне ...

В отличие от украденного фотоаппарата, CATT работает по принципу согласия. Как владелец камеры, вы регистрируетесь на сайте CATT, создаете профиль пользователя и затем регистрируете свои камеры.

Для этого вам необходимо сделать снимок некоторого случайно сгенерированного QRCode, отображаемого на экране. Затем вы загружаете неизмененное фото на сайт CATT. Когда загрузка завершена, сервер считывает метаданные фотографии и проверяет внедренный серийный номер. Он также пытается декодировать QRCode с картинки и сравнивает его с сохраненным хешем. Это сделано для того, чтобы никто не мог зарегистрировать вашу камеру, просто загрузив произвольную фотографию, сделанную этой камерой.

Когда ваша камера украдена, вы заходите на сайт CATT и помечаете это устройство как украденное. Чтобы отследить украденные камеры, мы запланировали анализатор серийных номеров exif на стороне клиента в javascript как скрипт mozilla greasemonkey (аналогично вашему расширению chrome). Он должен выполняться только на страницах flickr, содержащих оригинальные изображения (благодаря поддержке шаблонов URL greasemonkey), чтобы не слишком сильно замедлять работу браузера. Сценарий будет регулярно связываться с сервером CATT для получения списка украденных серийных видеокамер. Если серийный номер текущего отображаемого изображения показывает совпадение, он будет отображать предупреждение.

Я видел, что ваше расширение Chrome следует похожему подходу (хотя кажется, что он собирает сериалы). В вашем случае я бы использовал расширение с W3C File Api (в настоящее время Firefox и Chrome), чтобы пользователь мог также просматривать локально сохраненные фотографии, а не только те, которые встроены в веб-страницы. Это, безусловно, увеличит ваш «сбор серийного номера», потому что никакой «человек посередине» (flickr facebook и т. Д.) Не будет удалять данные exif.

Вот интересная демонстрация Mozilla по Exif Extraction с W3C File API .

fbuchinger
источник
Большое спасибо за это, отличная информация и идеи. QRCode v. Умный. Я не уверен, что понимаю, как File API так полезен для меня, как вы упомянули (кто разрешил бы локальный доступ к файлам и имел бы изображения с украденной камеры), но это именно то, что я ищу, чтобы написать простую Серийный инструмент извлечения для домашней страницы моего сайта. Вместо «Введите ваш серийный номер» я могу просто разрешить пользователям выполнять поиск с помощью изображения, которое у них уже есть (это также предотвращает ошибки). Еще одним преимуществом является то, что мне иногда приходится использовать внутренний серийный номер в качестве идентификатора, а не номер на коробке камеры.
Мэтт горит
Кстати, эта демонстрационная страница работала только для меня в Firefox, а не в Chrome. Я также начинаю думать, что эта страница не идеальна для обсуждения всего этого, но пока подойдет! пс. Сейчас я путешествую по Азии, поэтому не обижайтесь, если мне понадобится несколько дней (недель), чтобы ответить, ваши комментарии были очень полезны для меня, спасибо.
Мэтт горит
демонстрационная программа exif reader работает в chrome> 5, ошибка вызвана несущественной функцией ведения журнала (проверьте в консоли chrome и переопределите ее как пустую функцию). Счастливого путешествия!
fbuchinger
О случае использования локального файла: я думаю, что мы имеем в виду одно и то же - последовательное извлечение js cam для локальных файлов, которое является частью вашего сайта stolencamerafinder, а не обязательно расширения. Его можно использовать для определения статуса камеры на основе некоторого образца фотографии (например, сделанного во время покупки бывшей в употреблении камеры, чтобы убедиться, что она не была украдена у кого-то еще). Кстати: вы расширили парсер Exif Джейкоба Сайделина самостоятельно или извлечение серийного номера было его работой?
fbuchinger
Я расширил его синтаксический анализатор сам, но до сих пор смог получить его только для чтения разделов Canon и Panasonic. (мои знания формата IFD в лучшем случае плохие). Мне нужно отдать ему должное за его работу на моем сайте, так как это в основном его работа. Когда я буду доволен своими изменениями, я отправлю его ему в качестве возможного варианта улучшения / альтернативы.
Мэтт горит