Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Find page in PDF Version 11 (Python)

Группа действий: Распознавание текста 

Описание

Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.

Иконка

Image Removed

Параметры

Входные параметры  

Путь к файлу           Путь к PDF-файлу, страница которого будет использована для распознавания.

Основной язык       Язык, который распознаватель ожидает в тексте.

Текст                        Текст, который должна содержать страница.

Выходные параметры

Номер страницы Переменная, которая будет содержать номера всех найденных страниц.

Настройки

...

Путь к PDF-файлу, страница которого будет использована для распознавания.

...

Язык, который распознаватель ожидает в тексте.

По умолчанию значение равно "Русский".

Выпадающий список.

Справочник содержит следующие значения:

  • Russian - русский;
  • English - английский;
  • Русский и Английский;

Action group: Text recognition 

...

Description

This action is designed to search for a page by the entered value and retrieve its page number.

Action icon

Image Added

Settings

PropertyDescriptionTypeFilling exampleMandatory field
Parameters
PDF file pathPath to PDF fileRobin.FilePath
Yes
TextThe text that the search page should containRobin.String
Yes
Languages of text in the PDF file

Expected languages of text in the PDF file

A dropdown list of items:

  • Russian
  • English
  • Vietnamese
  • Arabic
  • Spanish
  • Portuguese
  • Persian
  • Turkish
  • Kazakh
  • Belarusian

Default value - Russian

Collection
No
Additional language

An additional language required for document recognition

A dropdown list of items:

  • No
  • Russian
  • English
  • Vietnamese
  • Arabic
  • Spanish
  • Portuguese
  • Indonesian
  • Persian
  • Turkish
  • Kazakh
  • Belarusian

The default value is No

If the same option is selected in the Language and Additional Language parameters, there will be no error. The duplicate will be counted as 1 language

Robin.String
No
Trained model

A file with a trained Tesseract model in the format .tessdata.

Allows you to load your own model trained on the required fonts

If the parameter is filled in, it will be prioritized over the “Language” and “Additional Language” parameters

Robin.FilePath
No
Results
Page numbersPage numbers where search text was foundRobin.Collection

Special conditions of use

None.

Example of use

Task

There is a document in PDF format , you need to find the pages where there is the text "Purpose and conditions of use". 

Solution 

Use the "Find a page in PDF" action. 

Implementation

  1. Move the "Find a page in PDF" action to the workspace. 
    Image Added

  2. Set "Find page in PDF" action parametersImage Added

  3. Click on the "Start" button in the top panel. 

Result

The program robot completed successfully. Pages with this text in the document were found. 

Image Added

...

Текст, который должна содержать страница.

...

Переменная, которая будет содержать номера всех найденных страниц.

Если страница не будет найдена, то будет выведена ошибка: "Не найдена страница, содержащая заданный текст."

...

Коллекция

Особые условия использования

Отсутствуют.

Пример использования 

Задача

Существует документ в формате pdf , необходимо найти страницы, где имеется текст "Назначение и условия применения". 

Решение 

Воспользоваться действием "Найти страницу в PDF". 

Реализация

...

Результат

Программный робот отработал успешно. Найдены страницы с данным текстом в документе. 

Image Removed