Как мне отредактировать текст в отсканированном формате .jpeg?

14

Мне нужно загрузить отсканированное изображение в виде документа PDF.

После сканирования документа у меня есть .jpegнебольшой текст, который я хочу отредактировать перед преобразованием в PDF для загрузки.

Я никогда не делал этого раньше, поэтому я действительно застрял. Как я могу это сделать?

Мистерио
источник
3
Используйте GIMP, чтобы удалить нежелательный текст, теперь это изображение, просто закройте его белым прямоугольником.
Ури Эррера
Я просто не хочу стирать это, я хочу заменить это только двумя словами
Mysterio
Поместите белый прямоугольник поверх того, что вам не нужно, а затем поместите текст с помощью инструмента «Текст».
Ури Эррера
1
@Mysterio это может подождать 9 часов? Если да, напишите мне по электронной почте документ, и я сделаю это, это легко. Если нет, см. Ответ OCR ниже и удачи.
Том Броссман
3
Если это касается приемной комиссии, целесообразно ли редактировать текст и пытаться сделать его подлинным? В зависимости от ситуации это может быть незаконно.
Восстановить Монику - Dec--

Ответы:

27

Чтобы сделать текст .jpegредактируемым, вам понадобится программа оптического распознавания символов (OCR). Я использую ocrfeeder.

sudo apt-get install ocrfeeder

Чтобы открыть файл изображения, нажмите на знак «плюс» (+).
введите описание изображения здесь После того как вы открыли изображение, нажмите на следующий значок справа, чтобы запустить OCR.
введите описание изображения здесь
После завершения распознавания изображения вы можете выбрать текст слева и скопировать его справа.
введите описание изображения здесь

Самый простой способ получить текст - просто скопировать его в LibreOffice. После небольшого редактирования моя копия выглядит очень похоже.

введите описание изображения здесь

После внесения необходимых изменений вы можете экспортировать их .pdf, нажав кнопку «Экспорт в формате PDF» на панели инструментов LibreOffice. введите описание изображения здесь

В конечном счете, лучше всего сканировать, .pdfесли вы можете. Если вы не можете, это работает очень хорошо.

ПРИМЕЧАНИЕ. OCR не является точным на 100%, возможно, вам придется исправлять ошибки, и чем больше форматирование вашего документа, тем сложнее это будет.

Сет
источник
3
+1, это определенно дает лучшие результаты. Другие методы, включающие манипулирование изображениями в формате JPEG, могут выглядеть довольно плохо, если в тексте есть псевдонимы. OCR позволяет избежать этой проблемы.
Том Броссман
@TimWolla Это зависит от того, является ли JPG графикой или текстом. Когда я прочитал вопрос, JPG был графикой с некоторым текстом.
philshem
11

Вы не можете редактировать текст в формате JPG, но вы удаляете текст и добавляете новый текст.

Для изображений попробуйте gimp (альтернатива Photoshop с открытым исходным кодом). Откройте изображение с помощью gimp, затем используйте инструмент ластик, чтобы стереть старый текст. Затем используйте текстовый инструмент, чтобы добавить новый текст.

Или используйте inkscape , программу для векторной графики (аналог Adobe Illustrator). Создайте новый файл SVG и вставьте его в свой JPG. Затем закройте старый текст новым текстовым полем.

Я бы начал с gimp, но для вашего изображения, возможно, Inkscape работает лучше. Вы можете установить либо код из центра программного обеспечения, либо использовать эти строки в терминале

sudo apt-get install gimp

sudo apt-get install inkscape
philshem
источник
7

Мы также можем редактировать текст поверх изображения в Libre Office, откуда мы также можем легко экспортировать эти файлы в PDF.

  • Откройте документ , чтобы вставить изображение с Вставка -> Фото -> Из файла ... .

    введите описание изображения здесь

  • Затем выберите «Wrap -> в фоновом режиме» с правой кнопкой мыши контекстное меню на картинке вы только что вставили.

  • Напишите любой текст над изображением (но мы должны будем разместить его с помощью новых строк, пробелов или табуляции). Любой существующий текст должен быть перезаписан. В приведенном ниже примере я сделал это, выбрав черный фон и белый цвет шрифта.

    введите описание изображения здесь

  • Наконец, мы можем сделать «Файл -> Экспорт в PDF ...» .

Takkat
источник
0

Вы не можете напрямую редактировать текст в файле изображения. Вы можете редактировать файл изображения с помощью программы, например, gimpи размещать новый текст поверх старого, но это все. Сожалею.

Алекс Л.
источник
Поиск программного обеспечения для распознавания текста . Вы неправильно поняли вопрос.
Лусио
0

Иногда я не хочу печатать страницу и конвертировать ее. Тогда я использую этот маленький скрипт:

Как можно мгновенно извлечь текст из области экрана, используя инструменты OCR?

Это самый быстрый способ конвертировать картинку в текст для меня, и он работает почти очень хорошо.

Поэтому я предлагаю вам отсканировать документ и открыть изображение. В то же время вы открываете редактор и копируете нужные вам части в редактор. С Easystroke вы делаете жест для сценария, это действительно легко и быстро.

Onar
источник