Вы просматриваете старую версию данной страницы. Смотрите текущую версию.

Сравнить с текущим просмотр истории страницы

« Предыдущий Версия 8 Следующий »

Получить текст из PDF Версия 9 (python)

Группа действий: Распознавание текста


Описание

Данное действие предназначено для распознавания текста из указанной страницы PDF документа и сохранения распознанного текста в переменную

Иконка действия


Параметры

Входные параметры:  

Источник                               Путь к PDF файлу для распознавания

Основной язык                     Языки, который распознаватель ожидает в тексте

Страница документа            Номер станицы файла, с которой будет считываться текст

Выходные параметры:

Результат                           Переменная, в которую будет сохранен распознанный текст

Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
ИсточникSource

Путь к PDF файлу для распознавания


Если тип файла неприменим, будет выведено предупреждение

Путь к файлу

C:\Users\Документы\1.pdfДа
Основной языкPrimary language

Языки, который распознаватель ожидает в тексте


Выпадающий список:

Справочник содержит следующие значения:

  • Русский - Russian;
  • Английский - English;
  • Русский и Английский;

По умолчанию значение равно "Русский"


СтрокаРусскийДа
Страница документа
Document page 

Номер станицы файла, с которой будет считываться текст



Если документ не содержит указанной страницы, ошибки не будет, будет пустой результат

Число2Да
Результаты
РезультатResult

Переменная, в которую будет сохранен распознанный текст


Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение

Строка



Особые условия использования

Отсутствуют.

Пример использования 

Задача: существует документ в формате pdf , необходимо получить текст с 2 страницы документа.

Решение: воспользоваться действием "Получить текст из PDF". 

Реализация:

  1. Перенести действие "Получить текст из PDF" на рабочую область. 

  2. Настроить параметры действия "Получить текст из PDF"

  3. Нажать на кнопку "Старт" в верхней панели. 

Результат:

Программный робот отработал успешно. Текст со 2 страницы документа получен. 

  • Нет меток