Каково общее правило для размеров файлов (в КБ, МБ, ГБ и т. Д.)? [закрыто]

3

У меня обычно возникают проблемы с интуитивным пониманием того, сколько я действительно могу хранить, когда кто-то говорит, что определенный продукт такой-то компании позволит вам хранить песни объемом 80 ГБ, а другой - 160 ГБ и так далее. Числа, стоящие сами по себе, кажутся настолько абстрактными, и мне кажется, что их можно измерить только относительно друг друга!

Мне просто интересно, есть ли какие-нибудь «правила» для разных файлов, таких как текстовый файл, mp3-файл, небольшой файл Word, видео, электронная почта и т. Д. Я понимаю, что даже в рамках определенного типа они все разные, но есть ли общее число, основанное на здравом смысле, которое обычно используется для их описания?

Текстовый файл - ?
mp3 файл -?
маленький файл Word -?
и т.д

Или, по крайней мере, есть ли быстрый способ приблизить его для каждого конкретного случая, с которым вы сталкиваетесь?

Темный тамплиер
источник

Ответы:

4
  • Для текстовых файлов это зависит от кодировки. Если вы используете ASCII, то это будет 1 байт / символ . Если вы используете UTF-8, то это будет зависеть от конкретных символов, варьируясь от 1 до 4 байт / символ . Но это в основном относится к восточноазиатским языкам с большим количеством символов. Если вы конвертируете файл ASCII (только латинский алфавит) в UTF-8, разница в размере файла должна быть минимальной.

  • Для файлов MP3 это действительно зависит от кодировки. Если у вас MP3 с высоким битрейтом, он займет намного больше места, чем что-то с низким битрейтом. Вы можете пойти на приблизительную оценку 5 МБ / файл, хотя.

  • Файлы Word зависят от формата .doc против .docx. По приблизительным оценкам, Word, вероятно, составляет 10 КБ / страницу , за исключением случаев, когда в них вставляются картинки (сложно предсказать размер).

Также помните разницу между десятичными префиксами SI и двоичными префиксами IEC: 1 килобайт (КБ) = 10 ^ 3 = 1000 байтов для SI, 1 кибибайт (КиБ) = 2 ^ 10 = 1024 байта. Хотя они не должны, большинство производителей жестких дисков смешивают это в свою пользу.

srunni
источник
Благодарю. Мне просто любопытно, но почему существуют разные кодировки символов? Почему нельзя просто придерживаться стандарта?
Темный тамплиер
1
@JacobHayden: Это потому, что не все там говорят по-английски. , ,
Surfasb
@JacobHayden: UTF-8 - это современный стандарт. ASCII - это наследие, оставшееся после того, как вычисления были в основном ограничены англоязычными странами, поэтому для экономии места (которого тогда было мало) были доступны только латинский алфавит, арабские цифры и некоторые знаки препинания.
Срунни
2

Сложность в том, что все ответы зависят от объема данных в файле, то есть вдвое больше страниц текста в текстовом файле удвоит размер файла.

  • Для текстовых файлов у меня есть около 2 КБ на страницу .
  • mp3-файл зависит как от длины, так и от степени сжатия. Для файла со скоростью 128 кбит / с (подобно файлам, распространяющимся по сетям P2P) это составляет около 1 МБ в минуту , поэтому песня в 3 минуты составляет 3 МБ . Для более качественных вещей, таких как то, что вы покупаете в iTunes или Amazon (256 кбит / с), это 2 МБ в минуту, поэтому та же самая 3- минутная песня составляет 6 МБ.
  • Файл Word сильно зависит от того, что вы в него вставили. Одностраничный файл .doc с обычным форматированием (т. Е. Абзацы, заголовки и прочее) составляет около 26 КБ плюс 4 КБ на страницу , в то время как для. DOCX размер составляет около 10 КБ плюс 3 КБ на страницу . Если вы добавите фотографии или что-то подобное, размер, конечно, будет надувным.
Мистер альфа
источник