Где я могу получить бесплатные общедоступные необработанные данные? [закрыто]

26

В веб-разработке гибридное приложение - это веб-страница или приложение, которое использует и объединяет данные , презентации или функциональные возможности из двух или более источников для создания новых сервисов.

Есть много источников для получения данных (необработанная информация). Правительства являются хорошими примерами.
Однако многие из них стоят и имеют сложное лицензирование. Например, SMHI в Швеции продает данные о температуре, в то время как наша соседняя страна Норвегия предоставляет их бесплатно.

Кто-то скажет, какое приложение вы создаете и какие данные вам нужны? Я бы сказал, дайте мне некоторые интересные данные, и я сделаю хороший гибрид из них. Я мог бы просто нанести это на карты Google, например.

Итак, вопрос: где я могу получить бесплатные данные?

Примечание: меня не интересует интеллектуальный анализ данных с использованием веб-сканера!

Пожалуйста, поделитесь своими источниками со мной.

Амир Резаи
источник
Какие данные вы ищете? Просто какие-нибудь данные вы можете получить бесплатно?
Джетти
Все данные, которые могут иметь значение для большого количества людей.
Амир Резаи
1
Как насчет odata.stackexchange.com ?
ChrisF
@ChrisF: «Эта страница содержит следующие ошибки: ошибка в строке 2 в столбце 29: Char 0x0 вне допустимого диапазона. Ниже приведено отображение страницы до первой ошибки.» При нажатии на ссылку одата.
Chris
@Chris - У меня все в порядке, но если у вас есть повторяемый случай, сообщите об этой проблеме команде в MSO. Я просто модератор;)
ChrisF

Ответы:

11

Для общей информации, хорошим местом для начала может быть страница открытых данных Википедии - в частности, нижние части страницы ( организации, продвигающие открытые данные , см. Также и внешние ссылки )

Я собирался превратить оставшуюся часть этого поста в список источников данных для страновых и региональных данных ... но британская газета Guardian уже собрала хранилище данных мирового правительства, так что нет смысла дублировать усилия, вместо этого я » просто укажу на ...

guardian.co.uk/world-government-data

... для каталога множества инициатив по открытым данным на уровне страны и города.
(Он не базируется в Великобритании, хотя, похоже, фокусируется на англоязычных странах.)

На момент редактирования он содержит данные по Великобритании, США, Австралии, Канаде, Новой Зеландии и Баскской Испании.

Одна вещь, не перечисленная там, но заслуживающая упоминания, это картографические данные Ordnance Survey UK .

Питер Боутон
источник
The Guardian также имеют привычку предоставлять данные, на которые ссылаются в их историях большую часть времени.
Джон Хопкинс
6

Есть данные повсюду каждого типа. Лучший подход - выяснить, какой тип данных вам нужен, найти веб-сайт, на котором он есть, и посмотреть, предлагает ли сайт API. Тем не менее, вот несколько общих источников:

Евгений Брикман
источник
3

С полным каталогом данных правительства США и поддерживаемых форматов можно ознакомиться здесь: http://www.data.gov/

Роберт Харви
источник
3

В Нью-Йорке есть несколько бесплатных каналов передачи данных MTA .

Есть также много других интересных публичных наборов данных в Нью-Йорке, таких как данные инспекции здоровья ресторана.

realworldcoder
источник
3

Кто-то задал почти тот же вопрос о Reddit Compsci некоторое время назад ... вот что я должен был сказать тогда . Я думаю, что все еще стоит.

Обойдите некоторые из этих сайтов, я уверен, что есть что-то, что может заинтересовать вас.

В зависимости от того, что вы пытаетесь сделать, существуют тонны и тонны наборов данных. С игрой, с которой интересно играть, но которая может быть, а может и не иметь к вам отношения, является набор данных электронной почты Enron . Это результат того, что во время большого скандала с Enron многие корпоративные электронные письма Enron были вызваны в суд и опубликованы .

И если вы не можете найти именно те данные, которые вам нужны, не стоит недооценивать возможность написания собственного сканера / скребка. В зависимости от того, какие данные вы хотите, может быть довольно просто просто просканировать Интернет для вашего собственного набора данных. Существуют всевозможные инструменты - от wget до Apache Droids - для помощи вам программно получать информацию.

Mindcrime
источник
2

В каталоге общедоступных данных Калгари есть кое-что из города Калгари, Альберта, Канада, которое свободно доступно.

Семинар «Открытые данные и инструменты интернет-демократии» был проведен в Калгари в минувшую субботу на тему использования этих данных для раскрытия.

JB King
источник
2

Данные о воде

Вы можете использовать NOAA для извлечения огромного количества данных для игры. Я использовал это несколько раз, и API не так уж и плох. Если тебя не волнует то, что и просто, как много , куда я пойду.

Джош К
источник