Вопросы с тегом «text-extraction»

385
Модуль Python для преобразования PDF в текст [закрыт]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме переполнения стека. Закрыто 5 лет назад . Улучшить этот вопрос Есть ли модуль Python для преобразования...

382
Как извлечь подстроку с помощью регулярных выражений

У меня есть строка с двумя одинарными кавычками, 'символ. Между одинарными кавычками находятся данные, которые я хочу. Как я могу написать регулярное выражение, чтобы извлечь "данные, которые я хочу" из следующего текста? mydata = "some string with 'the data i want'...

152
Как извлечь текст из PDF? [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос так, чтобы он был по теме переполнения стека. Закрыто 5 лет назад . Улучшить этот вопрос Кто-нибудь может порекомендовать библиотеку /...

87
Извлечение текста из файла PDF с помощью PDFMiner в Python?

Я ищу документацию или примеры того, как извлечь текст из файла PDF с помощью PDFMiner с Python. Похоже, PDFMiner обновил свой API, и все соответствующие примеры, которые я нашел, содержат устаревший код (классы и методы изменились). Обнаруженные мной библиотеки, упрощающие извлечение текста из...

82
Анализ PDF с использованием Python - извлечение форматированного и простого текста [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 5 лет назад . Уточните этот вопрос Я ищу библиотеку PDF, которая позволит мне...