Почему сканирование занимает так много места?

3

Если я хочу отсканировать документ, 10 страниц, каждая страница в формате PDF 300dpi, оттенки серого. 10 страниц 6 МБ. 40 страниц 24 МБ. FINE. Цвет, каждая страница 25 МБ Почему цвет 25 МБ?

Является ли PDF очень неэффективным? это делает текст и изображения.

Но гораздо больший вопрос,

И намного безумнее, чем это ... Я сканирую в 10 страниц в документ. Это занимает 1 ГБ в моей папке TEMP. ОДИН ГИГАБАЙТ !!!! Это обрабатывает это тогда, 1GB освобожден.

Но почему, черт возьми, целых 1 ГБ во время обработки !! Для документа 6 МБ!

Я думаю, что это было здесь C: \ Documents and Settings \ user \ Local Settings \ Temp \ MaglevExpressTemp

Программное обеспечение - Центр решений HP.

Другое программное обеспечение занимает столько места? некоторые хуже других? Не следует ли мне использовать центр решений HP для моего сканера HP?

barlop
источник
3
A4 составляет около 8,3x11,7 дюйма (буква не слишком далеко от этого, хорошо для приближения). При разрешении 300 точек на дюйм это ~ 8,7 миллиона пикселей на страницу. С 24 цветами (вероятно, по умолчанию) это не так уж далеко от 25 МБ. Вполне возможно, что сканер использует более высокое разрешение, и для окончательного вывода производится выборка с понижением частоты. 1200 точек на дюйм (не очень высокий для сканера) дает около 122 МБ на страницу для оттенков серого, цвет будет ~ 400 МБ. Так что ваши цифры кажутся вполне разумными. (Для сравнения, моим двум дисплеям в совокупности потребуется ~ 12 МБ, а это при разрешении менее 100 точек на дюйм).
Ричард
@Richard - был на полпути, хотя сам опубликовал это как ответ, когда заметил ваш комментарий. Вставьте это в ответ, и вы можете получить +1.
DMA57361,
хорошо бы увидеть расчет, который идет от точек на дюйм до МБ. получить 25 МБ для цвета или 8 МБ для оттенков серого. Получает страннее, потому что PDF 10 фото в оттенках серого, 6,35 МБ! Бот 80MB. Но это отдельный от действительно странной проблемы и большого вопроса, 1 ГБ!
Бароп
@ DMA57361: ОК, скоро :-)
Ричард,

Ответы:

9

Является ли PDF очень неэффективным?

Не особенно, как показывает ваш комментарий к Q:

потому что PDF 10 фото в оттенках серого, 6,35 МБ!

Все зависит от разрешения и уровня сжатия.

По сути, ответ таков: полные страницы довольно большие, а типичные разрешения при сканировании и печати довольно высокие: таким образом, большое количество данных.

Основной расчет:

A4 составляет около 8,3x11,7 дюйма (буква похожа, отличается не имеет значения). Итак, одна страница - 97 на 2 .

При разрешении 300 точек на дюйм 1 на 2 составляет 90000 пикселей. При 24 битах на пиксель (достаточно для 16 миллионов цветов) это около 260 КБ.

Таким образом, для 100in 2 потребуется около 26 МБ. Это соответствует вашим цифрам. NB Оттенки серого при 8 битах на пиксель (256 уровней) требуют примерно трети этого.

1 ГБ промежуточных файлов

Но если вы хотите получить конечный вывод 300 точек на дюйм, вам действительно нужно работать с более высоким разрешением до финальной стадии вывода (чтобы избежать артефактов: просто попробуйте несколько раз открыть и сохранить заново JPEG с даже умеренным сжатием, чтобы увидеть, как они быстро появляются).

Мой старый сканер (> 8 лет?) Работал бы со скоростью 2400 точек на дюйм (IIRC), поэтому что-то вроде 600 точек на дюйм было бы в пределах досягаемости большинства сканеров, так как это линейное измерение, для каждой области - и, следовательно, размер файла - увеличится с квадратом, что приводит к размеру файла в четыре раза больше.

Т.е. 100 МБ на изображение, поэтому следует ожидать 1 ГБ на 10.

Но конечный результат намного меньше

Это почти наверняка сжато. Безупречное сжатие изображений с большими областями постоянного цвета часто может быть сжато в 10 раз без существенной потери воспринимаемой информации для сканов и фотографий (которые имеют тенденцию иметь большое количество небольших вариаций, которые мы видим только при экстремальных уровнях масштабирования ) некоторые потери являются нормальными (как использует JPEG) и достигаются аналогичные коэффициенты сжатия.

Насколько большой это может быть?

Pro-DSLR используют 14 бит на цвет (сканер высокого уровня также должен уметь), то есть 42 бит на пиксель. Сканирование формата A4 со скоростью 4800 точек на дюйм приведет к получению необработанных данных размером GB11 ГБ для одной страницы.

Ричард
источник
Отличная работа! Вот это +1
DMA57361
впечатляет! но почему вы говорите: «При 24 битах на пиксель (достаточно для 24 миллионов цветов)» «очевидной» мыслью будет 2 ^ 24, 16 миллионов, потому что зная силу от двух до 2 ^ 20, можно увидеть, что 2 ^ 24 16 миллионов
Бароп
@ barlop хорошо заметили. 24 бита / пиксель является обычным (просто посмотрите на глубину цвета большинства рабочих столов Windows), потому что это три байта для представления каждого из красного, зеленого и синего (обычно) как значения от 0 до 255. Именно поэтому серая шкала обычно в третьем размере, поскольку для записи интенсивности от 0 до 255 используется только один байт. Я думаю, что 24 миллиона цветов - это ошибка, и вы правильно говорите, что 16,7 миллионов цветов - это правильно.
DMA57361
@ barlop: я называю это опечаткой :-) Теперь исправлено.
Ричард
1

если вы сканируете файлы как изображение .tiff, это создаст очень большое изображение. Вы должны иметь возможность сканирования в .png. Я также предпочитаю использовать XP Scanner и Camera Wizard для любого пакета сканера (Vista / 7 имеет сканеры и факсы).

tombull89
источник
XP сканер и мастер камеры с png, не похоже на хороший способ сканирования многостраничного документа, что я делаю и где я обнаружил проблему с пространством.
Бароп
0

Я заметил, что профессиональные сканы занимают примерно одну десятую места, как мое, хотя их качество немного лучше. Очевидно, они используют другой / лучший сканер, чем мой. (Все это в формате pdf, поэтому мы говорим яблоки с яблоками) Я имею в виду, что они могут выслать мне цветной документ из 10 страниц в разумном размере. Я никогда не смог бы сделать это со своим сканером.

Дэн Хоу
источник
2
Я уверен, что это не имеет ничего общего с качеством вашего сканера, но, вероятно, связано с чем-то вроде разрешения изображений. или программное обеспечение, которое использует их сканер, которое вы могли бы получить для своего сканера, а если нет, то вы можете конвертировать PDF в меньший размер. Как, был бы вопрос Adobe. Также действительно огромное количество места, на которое я ссылаюсь, находится во время сканирования, а не после.
Barlop