Например, если я собираюсь быть где-то удаленным и мне нужна Википедия целиком или переполнение стека, есть ли способ узнать, насколько велик размер конкретного веб-домена в ГБ?
Эта ссылка относится к устройству, которое соединяется со спутниками и обеспечивает ограниченную передачу данных в домашнюю точку доступа. Я хотел бы иметь возможность иметь целый веб-сайт, чтобы помочь сократить использование данных с такого рода устройства.
Ответы:
Википедия предлагает дамп данных в терабайтах данных.
За StackExchange По данным торрента, дамп данных за сентябрь 2014 года составляет 22,6 ГБ.
Другие сайты могут предлагать способ загрузки данных помимо просмотра веб-страниц. Если вы собираетесь очистить динамический веб-сайт, иногда вы можете оказаться в бесконечных циклах, что означает, что загружаемые вами данные могут никогда не закончиться. Если вы не обращаетесь к конкретным наборам информации или не знаете, что веб-сайт полностью статичен (только реальные страницы .HTML), вы не сможете легко определить, насколько большим будет сайт.
источник
Фонарь будет транслировать только определенное подмножество веб-сайтов. UUCP переизобретен, поэтому идея проверки размеров, скорее всего, не будет работать или будет необходима. это в одну сторону поэтому вам не нужно беспокоиться о размере данных & gt; это широковещательный средний, как старомодный телевизор или радио, а не двусторонний, как интернет. Итак, основная причина, по которой вы спрашиваете об этом ... ну, не будет проблемой. Википедия подводит итоги outernet довольно хорошо
Это интересная проблема, поэтому я попробую
Единственное, о чем я могу думать, это может работать с немного Веб-страницы должны использовать wget (с --spider, поэтому вы не загружаете страницу и --server-response, чтобы получить указанный размер файла). Этот подход был в значительной степени вдохновлен этим ТАК вопрос
Это работает с скажем superuser.com
Но нет, скажем
Google.com
источник
Нет.
Предполагая, что вы имеете в виду, перед загрузкой или вместо загрузки всего на свой компьютер и считая это там.
Не существует общепринятых общепринятых соглашений или методов, с помощью которых администраторы веб-сайтов предоставляют эту информацию.
Вы можете решить эту проблему для некоторых сайтов (см. Другие ответы), но способ, которым вы это делаете, и вероятный успех варьируются от сайта к сайту.
Они были бы в лучшем положении, чтобы обеспечить общий механизм для всех сайтов, но есть сложности
Если Google не может найти способ монетизации предоставления запрашиваемой вами информации, для них может быть не приоритетным предоставлять ее.
источник