Вы просматриваете старую версию данной страницы. Смотрите текущую версию.

Сравнить с текущим просмотр истории страницы

« Предыдущий Версия 7 Следующий »

Find page in PDF Version 11 (Python)

Action group: Text recognition 


Description

This action is designed to search for a page by the entered value and retrieve its page number.

Action icon

Settings

PropertyDescriptionTypeFilling exampleMandatory field
Parameters
PDF file pathPath to PDF fileRobin.FilePath
Yes
TextThe text that the search page should containRobin.String
Yes
Languages of text in the PDF file

Expected languages of text in the PDF file

Выпадающий список из элементов:

  • Русский
  • Английский
  • Вьетнамский
  • Арабский
  • Испанский
  • Португальский
  • Персидский
  • Турецкий
  • Казахский
  • Белорусский

Значение по умолчанию – Русский

Collection
No
Дополнительный язык

An additional language required for document recognition

Выпадающий список из элементов:

  • Нет
  • Русский
  • Английский
  • Вьетнамский
  • Арабский
  • Испанский
  • Португальский
  • Индонезийский
  • Персидский
  • Турецкий
  • Казахский
  • Белорусский

Значение по умолчанию – Нет

Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык

Robin.String
No
Обученная модель

A file with a trained Tesseract model in the format .tessdata.

Позволяет загрузить собственную модель, натренированную на необходимые шрифты

Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык"

Robin.FilePath
No
Results
Page numbersPage numbers where search text was foundRobin.Collection

Special conditions of use

None.

Example of use

Task

There is a document in pdf format , you need to find the pages where there is the text "Purpose and conditions of use". 

Solution 

Use the "Find a page in PDF" action. 

Implementation

  1. Move the "Find a page in PDF" action to the workspace. 


  2. Set "Find page in PDF" action parameters

  3. Click on the "Start" button in the top panel. 

Result

The program robot completed successfully. Pages with this text in the document were found. 


  • Нет меток