Найти, когда фраза была добавлена ​​на страницу Википедии

9

Есть ли способ найти, когда определенное слово или фраза были добавлены на страницу Википедии? Я хочу найти способ получить первую страницу, которая содержит совпадение определенной фразы (например, первое вхождение <ref>webapps.stackexchange.com</ref>в истории изменений страницы). (Ручной поиск по истории изменений страницы был бы чрезвычайно утомительным, поэтому мне понадобится какое-то автоматическое решение.)

Андерсон Грин
источник
Этот вопрос актуален (но, похоже, он обсуждает немного другую тему и требует определенных знаний о системах контроля версий): webapps.stackexchange.com/questions/15938/…
Андерсон Грин,
Чтобы помочь людям найти это через Google: Когда было добавлено слово на страницу Википедии?
fNek
@fNek Смотрите ответ ниже: вы можете использовать WikiBlame, чтобы найти, когда слово или фраза были добавлены на страницу.
Андерсон Грин

Ответы:

7

Существует инструмент под названием WikiBlame, который позволяет вам делать именно это: вы вводите имя страницы и фразу для поиска и указываете на правку, которая ее добавила.

Он также связан со страницей истории каждой страницы английской Википедии (как «Поиск истории изменений»).

svick
источник
На странице результатов поиска первое вхождение поисковой фразы находится рядом с «Вставка найдена между». Можно выполнить поиск по всей истории ревизий, набрав большое число в поле «Ревизии для проверки» (например, 10000.) Чтобы выполнить поиск исключительно по викитексту, выберите «принудительный поиск викитекста».
Андерсон Грин
Вот конкретный пример поиска (по фразе «основной игровой процесс» в статье «Minecraft»): wikipedia.ramselehof.de/…
Андерсон Грин,
1

Викимедиа предоставляет XML-дамп полной истории изменений для всех статей Википедии. Этот набор данных содержит версию этих данных за апрель 2010 года. Этот набор данных содержит не полный текст редакций, а только метаинформацию о редакциях, включая такие вещи, как язык, метка времени, статья и тому подобное.

На каждой странице в правом верхнем углу есть Historyкнопка, которая ведет вас к истории изменений для этой страницы.

введите описание изображения здесь

Источник: Wikipedia Revision History

abhshkdz
источник
Как вы можете получить дамп XML истории ревизий для конкретной страницы?
Андерсон Грин
Смотрите редактирование. Это то, что вы искали?
abhshkdz
Я бы предпочел какое-то автоматическое решение, вместо того чтобы вручную просматривать каждую ревизию, чтобы найти конкретную строку. Можно ли найти первое вхождение фразы в истории изменений (без ручного поиска, что может занять несколько часов)?
Андерсон Грин
1
Использование XML-дампа является излишним: вам действительно не нужно загружать полную историю изменений всех статей в Википедии только для поиска в истории одной статьи.
svick
Очевидно. Я просто выдавал любую доступную информацию.
abhshkdz