Аналитика: CloudFlare против Google - какое расхождение слишком велико?

10

Уже около недели мы используем CloudFlare для одного из наших сайтов, и CloudFlare сообщает о фактическом количестве просмотров страниц посетителя на 450% больше, чем Google Analytics (так что это не боты и не заблокированные угрозы).

Я понимаю, что будет расхождение, потому что CloudFlare измеряет все запросы страниц, Google Analytics запускает запрос JavaScript после загрузки страницы, поэтому я был готов к разнице в 20-30%, может быть, 50%, но 450%?

Кажется, где-то есть проблема. Я использовал отладчик Google Analytics для Chrome, и все, кажется, работает нормально. Код GA находится в голове, поэтому должен быть запущен довольно быстро.

Такой большой разрыв нормально? Если так, то почему, а если нет, то что на земле вызывает это?

обновленный

Извините, я не думаю, что я был ясен, я понял различия между статистикой CF и GA, прежде чем я начал с CF, и ожидал, что они будут другими. Это размер разницы, что касается.

CF четко отделяет ботов и сканеров от постоянных посетителей, поэтому цифра, которую я сравниваю с GA, это просто постоянные посетители; таким образом, разница говорит о том, что только 1 из 5 посетителей запускают Google Analytics ?

"your CloudFlare visitor number is most likely higher"

Не делает это справедливо!

CodeMonkey
источник
У меня та же проблема с еще большим расхождением. Я думаю, что количество посетителей может быть причиной. Сколько просмотров страниц ваш GA сообщает за месяц? Для меня количество просмотров страниц, сообщаемых CF за определенный период, составляет 223 000 000, в то время как число, сообщаемое GA, составляет 22 000 000. Это определенно не может быть связано с роботами или .js. Я думаю, что это связано с ограниченным объемом данных GA, поскольку, как сообщается, они не гарантируют доставку правильных данных для более чем 10 миллионов просмотров страниц в месяц. Во всяком случае, это то, что я думаю, и все же я не уверен.
Манучехр
Другое дело: если одно из ваших изображений связано с хотлинками, оно, вероятно, вызывает посещение Cloudflare, тогда как не должно. Это сложно. Я бы сказал, что надежные посещения, скорее всего, будут регистрироваться Google Analytics, а не Cloudflare.
Дэвид 天宇 Вонг

Ответы:

4

CloudFlare признают это и дают следующее объяснение :

CloudFlare Analytics против других сервисов

Google Analytics и другие веб-аналитические программы отслеживают посетителей, которые запускают JavaScript. В результате угрозы, боты и автоматизированные сканеры не регистрируются, поскольку эти посетители обычно не запускают JavaScript. Эти сервисы также не отслеживают посетителей, которые покидают страницу до ее полной загрузки или отключения Javascript. CloudFlare отслеживает весь ваш трафик по запросам, поэтому ваш номер посетителя CloudFlare, скорее всего, выше.

Помните: CloudFlare может отслеживать только посетителей, которые проходят через систему CloudFlare, которая представлена ​​оранжевым облаком на странице настроек DNS.

Они утверждают, что их собственная аналитика «часто более точна, чем другие сервисы, использующие JavaScript».

Эндрю Лотт
источник
спасибо за ваше время, но я понимаю причину, это то, что мой ум поражен масштабом разницы! Я обновил свой вопрос немного более подробно
CodeMonkey
4

Я наблюдал похожие различия при сравнении журналов Apache с аналитикой и видел (один день) соотношение 1000: 1. Удаленно возможно, что у вас есть какая-то пользовательская база, которая блокирует Google-Analytics с такими продуктами, как NoScript и Ghostery, или вообще не запускает никакой javascript. Я обнаружил, что Piwik дает лучшие отчеты и может быть настроен таким образом, чтобы блокировщики трекера не блокировали его скрипт, а пользователи без javascript все еще могли быть отслежены с помощью схемы отслеживания изображений 1x1 пикселей. Однако у меня нет никакого реального опыта работы с CloudFlare или CDN в целом, поэтому я не знаю, влияет ли это на отчетность Piwik.

Павел
источник
80% блокирования GA мне кажется очень высоким, это звучит нормально для вас? Из любопытства, что вы использовали для анализа журналов Apache и фильтрации ботов и угроз?
CodeMonkey
Я думаю, что типичный процент пользователей, активно блокирующих через плагины, был бы меньше 5%, но у меня нет реальной основы для этого, кроме наблюдения за привычками просмотра друзей, коллег и т. Д. Для журналов Apache я просто использую AWStats - hasn ' ничего не фильтровать, по крайней мере, не так, как я это настроил. Я переключился на Piwik, потому что на одном из моих сайтов нет скриптов, а для других сайтов мне больше нравятся отчеты.
Пол
2

Нетрудно понять, почему цифры Cloudflare намного выше, чем у вас, GA. причина в том, что Cloudflare - средний человек. позвольте мне объяснить подробно.

Вы видите, что когда кто-то заходит на веб-сайт, который использует Cloudflare, пользователи отправляют запрос в Cloudflare, который содержит всю информацию, такую ​​как IP-агент пользователя и тому подобное. поэтому даже не имеет значения, узнает ли пользователь, использующий такие расширения, как скрипт-блокировщик или другие Cloudflare, что кто-то посетил ваш сайт.

почему цифры высокие? Вы видите всякий раз, когда сайт регистрируется или домен, если быть точным, крупный человек, как Google, отправляет своих ботов для сбора информации. помните, что не только Google отправляет своих ботов, но есть много других. У Cloudflare есть много способов узнать, является ли он ботом или реальным человеком, но я не уверен, разделяют они или удаляют посещения ботов.

Кроме того, эти меры дифференциации могут быть легко обмануты.

Вывод: всякий раз, когда ваш сайт получает запрос, он добавляет +1 к общему количеству.

Дополнительные мысли: я не совсем уверен, но если вы добавите .js или .png или любые другие файлы на вашем веб-сайте. Ваш браузер отправляет запрос на указанную ссылку, которая также может учитываться как посещение сайта. Например: если на странице есть 10 фото и для загрузки всех, ваш браузер делает запрос ко всем этим фото в отдельности, что может сделать количество посещений от 1 до 11. (10 для фото и один для веб-сайта HTML)

user97589
источник
1

Я никогда не смотрел на свою Cloudflare Analytics до сих пор, но вы на самом деле ближе к Analytics, чем мои. Cloudflare сообщает 20-кратное количество уникальных посещений по сравнению с Google, и это примерно то же самое для просмотров страниц.

nathangiesbrecht
источник
Интересно, это то, что вы, вероятно, будете расследовать дальше?
CodeMonkey
Я немного просмотрел логи, и, похоже, в основном это боты, вызывающие расхождения. Это, и у меня есть проверка работоспособности, которая запускается в Google Docs, которая посещает сайт каждые 5 минут.
nathangiesbrecht
1

Я недавно уничтожил клиентский веб-сайт на базе WP и включил совершенно новый. В то же время я добавил CF на его новый сайт. Его старый сайт продолжал бить по серверам. Когда я создал новый сайт, я помешал им, уничтожив все старые URL-адреса изображений. Теперь CF сообщает о гораздо большем объеме трафика, чем GA, и я полагаю, что его bc запросов к серверу, на котором теперь 404 изображения, не найдены всеми ворами, связывают его старые изображения. Просто мои два цента.

Кристофер Скотт
источник