Eng_Получить текст из PDF

Получить текст из PDF Версия 9 (python)

Группа действий: Распознавание текста

Описание

Данное действие предназначено для распознавания текста из указанной страницы PDF документа и сохранения распознанного текста в переменную.

Настройки

Свойство	Англ. наименование	Описание	Тип	Пример заполнения	Обязательность заполнения поля
Параметры
Источник	Source	Путь к PDF файлу для распознавания. Если тип файла неприменим, будет выведено предупреждение.	Путь к файлу	C:\Users\Документы\1.pdf	Да
Основной язык	Primary language	Языки, который распознаватель ожидает в тексте. Выпадающий список: Справочник содержит следующие значения: Русский - Russian; Английский - English; Русский и Английский; По умолчанию значение равно "Русский".	Строка	Русский	Да
Страница документа	Document page	Номер станицы файла, с которой будет считываться текст. Если документ не содержит указанной страницы, ошибки не будет, будет пустой результат.	Число	2	Да
Результаты
Результат	Result	Переменная, в которую будет сохранен распознанный текст. Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение.	Строка

Особые условия использования

Отсутствуют.

Пример использования

Задача: существует документ в формате pdf , необходимо получить текст с 2 страницы документа.

Решение: воспользоваться действием "Получить текст из PDF".

Реализация:

Перенести действие "Получить текст из PDF" на рабочую область.
Настроить параметры действия "Получить текст из PDF"
Нажать на кнопку "Старт" в верхней панели.

Результат:

Программный робот отработал успешно. Текст со 2 страницы документа получен.

Дерево страниц

Eng_Получить текст из PDF

Получить текст из PDF Версия 9 (python)

Настройки

Особые условия использования

Пример использования