Вы просматриваете старую версию данной страницы. Смотрите текущую версию.

Сравнить с текущим просмотр истории страницы

Версия 1 Следующий »

Получить текст из PDF Версия 9 (python)

Группа действий: Распознавание текста


Описание

Данное действие предназначено для распознавания текста из указанной страницы PDF документа и сохранения распознанного текста в переменную.


Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
ИсточникSource

Путь к PDF файлу для распознавания.


Если тип файла неприменим, будет выведено предупреждение.

Путь к файлу

C:\Users\Документы\1.pdfДа
Основной языкPrimary language

Языки, который распознаватель ожидает в тексте.


Выпадающий список:

Справочник содержит следующие значения:

  • Русский - Russian;
  • Английский - English;
  • Русский и Английский;

По умолчанию значение равно "Русский".


СтрокаРусскийДа
Страница документа
Document page 

Номер станицы файла, с которой будет считываться текст.



Если документ не содержит указанной страницы, ошибки не будет, будет пустой результат.

Число2Да
Результаты
РезультатResult

Переменная, в которую будет сохранен распознанный текст.


Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение.

Строка



Особые условия использования

Отсутствуют.


Пример использования 

Задача: существует документ в формате pdf , необходимо получить текст с 2 страницы документа.

Решение: воспользоваться действием "Получить текст из PDF". 

Реализация:

  1. Перенести действие "Получить текст из PDF" на рабочую область. 

  2. Настроить параметры действия "Получить текст из PDF"

  3. Нажать на кнопку "Старт" в верхней панели. 

Результат:

Программный робот отработал успешно. Текст со 2 страницы документа получен. 

  • Нет меток