Вы просматриваете старую версию данной страницы. Смотрите текущую версию.

Сравнить с текущим просмотр истории страницы

« Предыдущий Версия 3 Следующий »

Получить текст из PDF Версия 9 (python)

Группа действий: Распознавание текста


Описание

Данное действие предназначено для распознавания текста из указанной страницы PDF документа и сохранения распознанного текста в переменную.


Параметры

Входные параметры:  

Источник                               Путь к PDF файлу для распознавания

Основной язык                     Языки, который распознаватель ожидает в тексте

Страница документа            Номер станицы файла, с которой будет считываться текст

Выходные параметры:

Результат                           Переменная, в которую будет сохранен распознанный текст

Настройки

СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Источник

Путь к PDF файлу для распознавания


Если тип файла неприменим, будет выведено предупреждение

Путь к файлу

C:\Users\Документы\1.pdfДа
Основной язык

Языки, который распознаватель ожидает в тексте


Выпадающий список:

Справочник содержит следующие значения:

  • Русский 
  • Английский 
  • Арабский
  • Вьетнамский
  • Испанский
  • Португальский
  • Русский и английский
  • Вьетнамский и английский
  • Арабский и английский
  • Испанский и английский
  • Португальский и английский

По умолчанию значение равно "Русский"


СтрокаРусскийДа
Страница документа

Номер станицы файла, с которой будет считываться текст



Если документ не содержит указанной страницы, ошибки не будет, будет пустой результат

Число2Да
Результаты
Результат

Переменная, в которую будет сохранен распознанный текст


Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение

Строка



Особые условия использования

Отсутствуют.

Пример использования 

Задача

Существует документ в формате pdf , необходимо получить текст с 2 страницы документа.

Решение

Воспользоваться действием "Получить текст из PDF". 

Реализация

  1. Перенести действие "Получить текст из PDF" на рабочую область. 

  2. Настроить параметры действия "Получить текст из PDF"

  3. Нажать на кнопку "Старт" в верхней панели. 

Результат:

Программный робот отработал успешно. Текст со 2 страницы документа получен. 

  • Нет меток