Моя мама проходит некоторые онлайн-курсы, чтобы быть своего рода библиотекарем, в этом курсе они охватывают булевы поиски, поэтому они могут эффективно выполнять поиск в базах данных, однако у нее возник вопрос, звучащий примерно так:
Поиск "x ИЛИ y" приведет к 105 000 обращений, в то время как поиск только x приведет к 80 000 обращений, а поиск только y даст 35 000 обращений. Почему поиск "x ИЛИ y" дает 105 000 обращений, тогда как объединенные отдельные поиски дают 115 000 обращений?
Для меня это звучало странно, поэтому я сам проверил это, используя слова « бекон и бутерброд» .
- Только бекон получился 179 000 000 результатов
- Только бутерброд получился 312 000 000 результатов
- Бекон ИЛИ бутерброд дал 491 000 000 результатов
Но для меня это составляет: 179 000 000 (бекон) + 312 000 000 (сэндвич) = 491 000 000 (сало или сэндвич)
Почему запрос OR может привести к меньшему количеству обращений, чем оба отдельных запроса вместе взятых?
Ответы:
Подсказка: поиск x AND y даст 10 000 просмотров.
источник
Принцип подсчета, который здесь применяется, это включение-исключение .
Чтобы числа работали, должно быть 10000.| Икс∩ Y|
Диаграмма Венна может быть более убедительной для кого-то, кого пугает нотация.
источник
Документ 1: Кошка на столе
Документ 2: Моя кошка черная
Документ 3: Собака под столом
Документ 4: Как зовут вашу кошку?
Документ 5: Это черно-белая фотография
Поиск cat : возвращенных документов 1,2,4 (возвращено 3 документа)
Поиск черного : возвращенных документов ...
Поиск cat ИЛИ черного : возвращенных документов ...
:-D :-D
источник
Простыми словами:
Поиск X дает вам n ответов.
Поиск Y дает вам m ответов.
Поиск X И Y дает вам p ответов.
При поиске X OR Y поиск прекращается, как только он находит X или Y. Поэтому, если перед Y стоит X, этот Y не будет учитываться при поиске X OR Y. Следовательно, ваш поиск X OR Y даст вам n + m - p ответов.
Важно отметить, что результаты будут одинаковыми, независимо от того, выполняете ли вы 2 поиска или только один. Просто при суммировании двух поисков некоторые документы учитываются дважды.
источник
Представьте, что у вас есть только один документ. Это Документ № 1 с этим:
Теперь представьте, что у вас есть функция поиска, которая может предоставить вам все документы по одному ключевому слову:
Обратите внимание, что количество документов в обоих случаях равно 1. Теперь, если у вас есть функция поиска, которая дает вам количество документов, которые соответствуют одному или нескольким из указанных ключевых слов:
Когда вы добавляете количество документов, содержащихся,
X
к количеству документов, содержащихсяY
, это заставляет вас считать один и тот же документ дважды. В вашем случае это случилось10000
раз, как указано выше :)источник