Просмотреть исходный

Найти страницу в PDF Версия 11(Python)

Группа действий: Распознавание текста

Описание

Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.

Иконка действия

Параметры

Входные параметры

Путь к файлу Путь к PDF-файлу, страница которого будет использована для распознавания

Основной язык Язык, который распознаватель ожидает в тексте

Текст Текст, который должна содержать страница

Выходные параметры

Номер страницы Переменная, которая будет содержать номера всех найденных страниц

Настройки

Свойство	Описание	Тип	Пример заполнения	Обязательность заполнения поля
Параметры
Путь к файлу	Путь к PDF-файлу, страница которого будет использована для распознавания	Путь к файлу	C:\Users\Документы\1.pdf	Да
Язык	Ожидаемый язык текста в PDF-файле Выпадающий список из элементов: Русский Английский Вьетнамский Арабский Испанский Португальский Персидский Турецкий Казахский Белорусский Значение по умолчанию – Русский	Коллекция	Русский	Нет
Текст	Текст, который должна содержать искомая страница	Строка	Загрузить	Да
Дополнительный язык	Дополнительный язык, необходимый для распознавания документа Выпадающий список из элементов: Нет Русский Английский Вьетнамский Арабский Испанский Португальский Индонезийский Персидский Турецкий Казахский Белорусский Значение по умолчанию – Нет Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык	Строка		Нет
Обученная модель	Файл с обученной моделью Tesseract в формате .taineddata. Позволяет загрузить собственную модель, натренированную на необходимые шрифты Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык"			Нет
Результаты
Номер страницы	Номера страниц, на которых был найден искомый текст Если страница не будет найдена, то будет выведена ошибка: "Не найдена страница, содержащая заданный текст	Коллекция

Особые условия использования

Отсутствуют.

Пример использования

Задача

Существует документ в формате pdf , необходимо найти страницы, где имеется текст "Назначение и условия применения".

Решение

Воспользоваться действием "Найти страницу в PDF".

Реализация

Перенести действие "Найти страницу в PDF" на рабочую область.
Настроить параметры действия "Найти страницу в PDF"
Нажать на кнопку "Старт" в верхней панели.

Результат

Программный робот отработал успешно. Найдены страницы с данным текстом в документе.