Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Найти страницу в PDF

...

Версия 11(Python)

Группа действий: Распознавание текста 

...

Описание

Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.

Иконка действия

Image Removed

...

Image Added

Параметры  и их настройки

Свойство
Англ. наименование
ОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлу
Path to file

Путь к PDF-файлу, страница которого будет использована для распознавания

.

Путь к файлуC:\Users\Документы\1.pdfДа
Язык
Основной

Ожидаемый язык

Primary language

Язык, который распознаватель ожидает в тексте.

По умолчанию значение равно "Русский".

Выпадающий список.

Справочник содержит следующие значения:

текста в PDF-файле


Выпадающий список из элементов:

  • Русский
  • Английский
  • Вьетнамский
  • Арабский
  • Испанский
  • Португальский
  • Персидский
  • Турецкий
  • Казахский
  • Белорусский

Значение по умолчанию – Русский

  • Russian - русский;
  • English - английский;
  • Русский и Английский;

    КоллекцияРусский
    Да
    Нет
    Текст
    Text

    Текст, который должна содержать искомая страница

    .

    СтрокаЗагрузитьДа
    Дополнительный язык

    Дополнительный язык, необходимый для распознавания документа

    Выпадающий список из элементов:

    • Нет
    • Русский
    • Английский
    • Вьетнамский
    • Арабский
    • Испанский
    • Португальский
    • Индонезийский
    • Персидский
    • Турецкий
    • Казахский
    • Белорусский

    Значение по умолчанию – Нет

    Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык

    Строка
    Нет
    Обученная модель

    Файл с обученной моделью Tesseract в формате .taineddata.

    Позволяет загрузить собственную модель, натренированную на необходимые шрифты

    Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык"



    Нет
    Результаты
    Номер страницы
    Page numberПеременная, которая будет содержать номера всех найденных страниц.

    Номера страниц, на которых был найден искомый текст


    Если страница не будет найдена, то будет выведена ошибка: "Не найдена страница, содержащая заданный текст

    ."

    Коллекция



    Особые условия использования

    Отсутствуют.

    Пример использования 

    Задача

    Существует : существует документ в формате pdf , необходимо найти страницы, где имеется текст "Назначение и условия применения". 

    Решение 

    Решение: воспользоваться Воспользоваться действием "Найти страницу в PDF". 

    Реализация

    ...

    1. Перенести действие "Найти страницу в PDF" на рабочую область. 
      Image Modified
    2. Настроить параметры действия "Найти страницу в PDF"
      Image Modified
    3. Нажать на кнопку "Старт" в верхней панели. 

    Результат

    ...

    Программный робот отработал успешно. Найдены страницы с данным текстом в документе. 

    Image Modified