Есть ли способ отфильтровать таблицы в Википедии?

12

Я ищу способ фильтрации таблиц, часто встречающихся в статьях Википедии, чтобы я мог сравнивать только интересующие меня строки (и столбцы).

Есть ли

  1. встроенная функция в движке Wikipedia, о которой я не знаю
  2. или плагин для браузера, который поддерживает это

Особенности, которые я могу придумать:

  • Фильтровать по значению столбца
  • Скрыть столбцы
  • Многоуровневая сортировка
рыба фугу
источник
Аааа ... не по теме минное поле. Смотрите пункт 3 в первой таблице. Я прошу что-то конкретное для Википедии. На самом деле скрипт Greasemonkey подойдет, но не смог его найти
pufferfish

Ответы:

8

Если вы поместите эту формулу в ячейку в Google Sheet, она извлечет табличные данные из этой ссылки на статью в Википедии: http://en.wikipedia.org/wiki/Demographics_of_India

=IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India", "table", 4)

Когда у вас есть данные в Google Sheet, вы можете фильтровать по значению столбца (выбрать заголовок столбца, выбрать « Фильтр из меню данных» ) и скрыть столбец (выбрать столбец, выбрать « Скрыть столбец из контекстного меню»).

Снимок экрана Google Sheets

mvark
источник
1

Таблицы? Вы имеете в виду инфобоксы? Вам, вероятно, следует использовать Wikidata http://wikidata.org/w/api.php и извлечь информацию оттуда (она будет более чистой), а затем представить ее, как вы предпочитаете.

В противном случае вы можете display: noneповсюду посыпать соответствующие идентификаторы и классы для рассматриваемых таблиц, но это будет бесконечная погоня за неструктурированной информацией.

Nemo
источник
1

Wikipedia Таблица фильтр Greasemonkey скрипт делает то , что вы хотите:

Сводка скрипта: Фильтрует таблицы википедии, удаляя все строки, которые имеют нежелательное значение, или удаляя определенные строки и столбцы.

Возможно, вам придется добавить httpsверсию URL-адреса википедии в список фильтров включенных страниц скрипта, чтобы заставить его работать.

naught101
источник