Найти страницу в PDF Версия 11(Python)
Группа действий: Распознавание текста
Описание
Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.
Иконка действия
Параметры и их настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|
Параметры | ||||
Путь к файлу | Путь к PDF-файлу, страница которого будет использована для распознавания | Путь к файлу | C:\Users\Документы\1.pdf | Да |
Язык | Ожидаемый язык текста в PDF-файле Выпадающий список из элементов:
Значение по умолчанию – Русский | Коллекция | Русский | Нет |
Текст | Текст, который должна содержать искомая страница | Строка | Загрузить | Да |
Дополнительный язык | Дополнительный язык, необходимый для распознавания документа Выпадающий список из элементов:
Значение по умолчанию – Нет Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык | Строка | Нет | |
Обученная модель | Файл с обученной моделью Tesseract в формате .taineddata. Позволяет загрузить собственную модель, натренированную на необходимые шрифты Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык" | Нет | ||
Результаты | ||||
Номер страницы | Номера страниц, на которых был найден искомый текст Если страница не будет найдена, то будет выведена ошибка: "Не найдена страница, содержащая заданный текст | Коллекция |
Особые условия использования
Отсутствуют.
Пример использования
Задача
Существует документ в формате pdf , необходимо найти страницы, где имеется текст "Назначение и условия применения".
Решение
Воспользоваться действием "Найти страницу в PDF".
Реализация
- Перенести действие "Найти страницу в PDF" на рабочую область.
- Настроить параметры действия "Найти страницу в PDF"
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно. Найдены страницы с данным текстом в документе.