Какие сайты выставляют серийные номера корпуса камеры из оригинального изображения EXIF?
Flickr - это веб-сайт для обмена фотографиями, который предоставляет множество метаданных фотографий (из данных EXIF ) и даже облегчает доступ к ним благодаря API Flickr . Picasaweb от Google также предлагает некоторую информацию из EXIF, но не серийный номер.
Есть ли другие сайты, которые могут мне помочь?
В качестве предыстории того, что я делаю, я пытаюсь сопоставить базу данных серийных номеров камер и URL-адресов изображений, где они были найдены. Это только я делаю что-то бесплатно в надежде, что мы сможем поймать людей, которые крадут наши драгоценные камеры! Я надеюсь, что это не слишком не по теме, потому что я не пытаюсь ничего продать, просто пытаюсь сделать что-то хорошее!
Отказ от ответственности: я автор украденных камерфиндер ;)
Обновление - по запросу fbuchinger, вот быстрое обновление статуса проекта:
Многие сайты (включая, к сожалению, Facebook) убирают подписи с EXIF. До сих пор я обнаружил, что самым богатым источником серийных номеров является Flickr. Я полагаю, это потому, что люди часто загружают полноразмерные (читай «неотредактированные») изображения. На моем сайте ( stolencamerafinder.com ) я предлагаю Java-приложение для веб-старта, которое собирает данные flickr через его API. Поскольку существует ограничение на скорость, с которой я выполняю вызовы API, я написал это так, чтобы работа распределялась между числом клиентов веб-запуска, таким образом, уменьшая пропускную способность и ЦП на клиентах, чем больше людей запускают его. Если вы читаете это и у вас есть, скажем, административный доступ к рабочему серверу, который мало что делает, почему бы не оставить его включенным там;)
Я также написал плагин для Google Chrome, который просто следит за изображениями на веб-сайтах со встроенным серийным номером. Я не ожидаю очень высокой доходности от этого приложения, основная идея состояла в том, чтобы выяснить, какие сайты могут быть хорошими источниками для написания сделанных на заказ инструментов для паутинга, а затем сканировать их.
Я опубликовал свой API для stolencamerafinder и ищу других программистов, которые помогут мне писать программы, которые могут служить поисковыми роботами.
В ходе этого проекта я собрал много интересных данных, которые скоро выложу на сайт, например, о том, какие модели камер делают и не пишут полезные серийные номера. Например, Nikon D50 просто пишет «D50» в качестве серийного номера!
Я был бы чрезвычайно признателен за любые отзывы (хорошие или плохие!), Которые вы можете получить о моем проекте.
Матф
Ответы:
Мне нравится идея ловца воров. ;)
Я заметил, что DeviantArt.com, кажется, «захватывает» все метаданные EXIF, которые встроены в любые загруженные изображения. Это не показывает все это, однако есть некоторые части сайта (многие из них только для платных участников), которые показывают более подробную информацию о загруженном изображении, и я видел полные данные тега в списке.
Я думаю, технически говоря, если бы вы могли сделать что-то похожее на TinEye.com (Reverse Image Search), который индексирует изображения и выполняет поиск по сходству контента. TinEye удобен тем, что сопоставляет изображения по содержанию, но имеет свои ограничения. Фотоманипуляции, созданные с помощью фото, защищенного авторским правом, трудно идентифицировать. Поиск по серийному номеру обеспечит альтернативный, бесплатный подход.
Технически вы можете получить любые exif-данные, встроенные в изображения, загруженные в Интернет. Если серийный номер камеры введен, у вас будет то, что вы ищете. Вам нужно будет собрать копию каждого изображения с сайтов, которые вы проиндексировали, извлечь любые EXIF (или другие данные тега) из проиндексированных изображений и отследить информацию со ссылкой на источник. Возможно, вы также можете использовать основные поисковые системы, такие как Bing и Google, для поиска изображений для индексации (может быть достаточно базового поиска изображений по ключевым словам, таких как имена фотографов, местоположения и т. Д.) Вероятно, вам не нужно будет держать изображение рядом (и в любом случае это может повлечь за собой юридические проблемы), но, по крайней мере, у вас будет индекс данных тега EXIF / IPTC, возможно, серийный номер и ссылка на источник.
источник
ОБНОВИТЬ:
Спасибо за обновление статуса проекта! Прежде всего интересен подход с приложением Java WebStart. Используете ли вы разные ключи API Flickr для каждого экземпляра WebStart, или Flickr ограничивает запросы API, основанные на комбинации ключа API / IP-адреса?
Я запустил ваше приложение веб-запуска, и после сканирования 50 фотографий было получено 0 серийных номеров. Я не смотрел на ваш исходный код, но вы должны знать, что только крошечное меньшинство камер (в основном dslrs) записывают серийные номера в метаданные exif.
Я бы порекомендовал загрузить образцы изображений из метаинформационного репозитория Фила Харви и запустить на нем exiftool, чтобы увидеть, какие модели действительно дают серийные номера. Затем вы можете сузить поиск приложений в веб-старте до этих моделей и тем самым значительно повысить коэффициент успеха.
Я наткнулся на ваш вопрос, когда только начал изучать photo.stackexchange.com.
2 года назад у меня была идея, очень похожая на stolencamerafinder, и я фактически начал реализовывать ее на python. Однако я остановил это по разным причинам:
Большинство серийных номеров камер, хранящихся в данных EXIF, доступны для редактирования и, следовательно, являются поддельными (по крайней мере, с помощью exiftool) -> риск ложных предупреждений или «спама с серийным номером» (по крайней мере, когда служба начинает становиться популярной)
Большинство людей используют загрузчики изображений, которые изменяют размер своих изображений и, таким образом, часто отбрасывают все или многие части данных EXIF (помните, что серийный номер всегда хранится в некотором проприетарном exif makernote, который часто отбрасывается во время преобразования изображений) -> низкое соотношение проверенных изображений : извлеченные серийные номера.
однако мне любопытно, как развивался ваш проект ... не могли бы вы дать краткое резюме статуса?
источник
Поскольку мой первый ответ более сфокусирован на технических деталях, я решил открыть второй ответ, чтобы дать вам краткий обзор моей первоначальной идеи «camerafinder», получившей название «CATT» (Camera Anti Theft Tool). Не стесняйтесь использовать мои идеи, но, пожалуйста, поверьте мне ...
В отличие от украденного фотоаппарата, CATT работает по принципу согласия. Как владелец камеры, вы регистрируетесь на сайте CATT, создаете профиль пользователя и затем регистрируете свои камеры.
Для этого вам необходимо сделать снимок некоторого случайно сгенерированного QRCode, отображаемого на экране. Затем вы загружаете неизмененное фото на сайт CATT. Когда загрузка завершена, сервер считывает метаданные фотографии и проверяет внедренный серийный номер. Он также пытается декодировать QRCode с картинки и сравнивает его с сохраненным хешем. Это сделано для того, чтобы никто не мог зарегистрировать вашу камеру, просто загрузив произвольную фотографию, сделанную этой камерой.
Когда ваша камера украдена, вы заходите на сайт CATT и помечаете это устройство как украденное. Чтобы отследить украденные камеры, мы запланировали анализатор серийных номеров exif на стороне клиента в javascript как скрипт mozilla greasemonkey (аналогично вашему расширению chrome). Он должен выполняться только на страницах flickr, содержащих оригинальные изображения (благодаря поддержке шаблонов URL greasemonkey), чтобы не слишком сильно замедлять работу браузера. Сценарий будет регулярно связываться с сервером CATT для получения списка украденных серийных видеокамер. Если серийный номер текущего отображаемого изображения показывает совпадение, он будет отображать предупреждение.
Я видел, что ваше расширение Chrome следует похожему подходу (хотя кажется, что он собирает сериалы). В вашем случае я бы использовал расширение с W3C File Api (в настоящее время Firefox и Chrome), чтобы пользователь мог также просматривать локально сохраненные фотографии, а не только те, которые встроены в веб-страницы. Это, безусловно, увеличит ваш «сбор серийного номера», потому что никакой «человек посередине» (flickr facebook и т. Д.) Не будет удалять данные exif.
Вот интересная демонстрация Mozilla по Exif Extraction с W3C File API .
источник