Find page in PDF Version 11 (Python)
Action group: Text recognition
Description
This action is designed to search for a page by the entered value and retrieve its page number.
Action icon
Settings
Property | Description | Type | Filling example | Mandatory field |
---|---|---|---|---|
Parameters | ||||
PDF file path | Path to PDF file | Robin.FilePath | Yes | |
Text | The text that the search page should contain | Robin.String | Yes | |
Languages of text in the PDF file | Expected languages of text in the PDF file Выпадающий список из элементов:
Значение по умолчанию – Русский | Collection | No | |
Дополнительный язык | An additional language required for document recognition Выпадающий список из элементов:
Значение по умолчанию – Нет Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык | Robin.String | No | |
Обученная модель | A file with a trained Tesseract model in the format .tessdata. Позволяет загрузить собственную модель, натренированную на необходимые шрифты Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык" | Robin.FilePath | No | |
Results | ||||
Page numbers | Page numbers where search text was found | Robin.Collection |
Special conditions of use
None.
Example of use
Task
There is a document in pdf format , you need to find the pages where there is the text "Purpose and conditions of use".
Solution
Use the "Find a page in PDF" action.
Implementation
- Move the "Find a page in PDF" action to the workspace.
- Set "Find page in PDF" action parameters
- Click on the "Start" button in the top panel.
Result
The program robot completed successfully. Pages with this text in the document were found.