Найти страницу в PDF Версия 11(Python)

Группа действий: Распознавание текста 


Описание

Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.

Иконка действия

Параметры  и их настройки

СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлу

Путь к PDF-файлу, страница которого будет использована для распознавания

Путь к файлуC:\Users\Документы\1.pdfДа
Язык

Ожидаемый язык текста в PDF-файле


Выпадающий список из элементов:

  • Русский
  • Английский
  • Вьетнамский
  • Арабский
  • Испанский
  • Португальский
  • Персидский
  • Турецкий
  • Казахский
  • Белорусский

Значение по умолчанию – Русский

КоллекцияРусскийНет
Текст

Текст, который должна содержать искомая страница

СтрокаЗагрузитьДа
Дополнительный язык

Дополнительный язык, необходимый для распознавания документа

Выпадающий список из элементов:

  • Нет
  • Русский
  • Английский
  • Вьетнамский
  • Арабский
  • Испанский
  • Португальский
  • Индонезийский
  • Персидский
  • Турецкий
  • Казахский
  • Белорусский

Значение по умолчанию – Нет

Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык

Строка
Нет
Обученная модель

Файл с обученной моделью Tesseract в формате .taineddata.

Позволяет загрузить собственную модель, натренированную на необходимые шрифты

Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык"



Нет
Результаты
Номер страницы

Номера страниц, на которых был найден искомый текст


Если страница не будет найдена, то будет выведена ошибка: "Не найдена страница, содержащая заданный текст

Коллекция



Особые условия использования

Отсутствуют.

Пример использования 

Задача

Существует документ в формате pdf , необходимо найти страницы, где имеется текст "Назначение и условия применения". 

Решение 

Воспользоваться действием "Найти страницу в PDF". 

Реализация

  1. Перенести действие "Найти страницу в PDF" на рабочую область. 
  2. Настроить параметры действия "Найти страницу в PDF"
  3. Нажать на кнопку "Старт" в верхней панели. 

Результат

Программный робот отработал успешно. Найдены страницы с данным текстом в документе.


  • Нет меток