Мне интересно, как крупные сайты, такие как StackOverflow, обрабатывают свои журналы доступа. Запись на диск по каждому запросу кажется немного неэкономичной, но насколько надежна Google Analytics, чтобы использовать ее в качестве единственного информационного ресурса?
google-analytics
analytics
traffic
logging
apache-log-files
Стивен Остермиллер
источник
источник
Ответы:
В системе * nix вы можете использовать syslog-ng для хранения сообщений журнала на выделенном сервере журналов для кластеров с балансировкой нагрузки, а затем использовать решение для анализа журналов, такое как Splunk, для отслеживания событий - что касается сайтов StackExchange. на самом деле запустить, может быть, хороший вопрос для StackOverflow Meta .
источник
В журналах веб-сервера содержится много информации, которая никогда не будет доступна для Google Analytics. Вот две вещи, о которых я могу подумать:
&source=products
и т. Д.Должно быть больше вещей, о которых я просто не могу думать прямо сейчас.
И есть также журналы ошибок; должно быть важно, чтобы сайт работал нормально, на мой взгляд. Не то, что вы игнорировали бы.
источник
Я действительно не смотрю на эти журналы и в конечном итоге удаляю их ежемесячно. Я только смотрю на них для устранения проблем. Что касается приложения для мониторинга использовать Google Analytics, CrazyEgg и другие делают большую работу.
До появления таких сервисов эти журналы были очень ценными. Теперь они являются хорошими инструментами для разработчиков, но я не знаю ни одного из моих коллег или друзей, которые бы активно архивировали эти журналы или анализировали их на предмет данных.
источник