Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Найти страницу в PDF Версия

...

11(Python)

Группа действий: Распознавание текста 

...

Описание

Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.

Иконка действия

Image Removed

Параметры

Входные параметры  

Путь к файлу           Путь к PDF-файлу, страница которого будет использована для распознавания.

Основной язык       Язык, который распознаватель ожидает в тексте.

Текст                        Текст, который должна содержать страница.

Выходные параметры

Номер страницы Переменная, которая будет содержать номера всех найденных страниц.

Настройки

Image Added

Параметры  и их настройки

СвойствоАнгл. наименование
Свойство
ОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлу
Path to file

Путь к PDF-файлу, страница которого будет использована для распознавания

.

Путь к файлуC:\Users\Документы\1.pdfДа
Основной языкPrimary language

Язык, который распознаватель ожидает в тексте.

По умолчанию значение равно "Русский".

Выпадающий список.

Справочник содержит следующие значения:

Язык

Ожидаемый язык текста в PDF-файле


Выпадающий список из элементов:

  • Русский
  • Английский
  • Вьетнамский
  • Арабский
  • Испанский
  • Португальский
  • Персидский
  • Турецкий
  • Казахский
  • Белорусский

Значение по умолчанию – Русский

  • Russian - русский;
  • English - английский;
  • Русский и Английский;

    КоллекцияРусский
    Да
    Нет
    Текст
    Text

    Текст, который должна содержать искомая страница

    .

    СтрокаЗагрузитьДа
    Дополнительный язык

    Дополнительный язык, необходимый для распознавания документа

    Выпадающий список из элементов:

    • Нет
    • Русский
    • Английский
    • Вьетнамский
    • Арабский
    • Испанский
    • Португальский
    • Индонезийский
    • Персидский
    • Турецкий
    • Казахский
    • Белорусский

    Значение по умолчанию – Нет

    Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык

    Строка
    Нет
    Обученная модель

    Файл с обученной моделью Tesseract в формате .taineddata.

    Позволяет загрузить собственную модель, натренированную на необходимые шрифты

    Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык"



    Нет
    Результаты
    Номер страницы
    Page numberПеременная, которая будет содержать номера всех найденных страниц.

    Номера страниц, на которых был найден искомый текст


    Если страница не будет найдена, то будет выведена ошибка: "Не найдена страница, содержащая заданный текст

    ."

    Коллекция



    Особые условия использования

    ...

    1. Перенести действие "Найти страницу в PDF" на рабочую область. 
      Image Modified
    2. Настроить параметры действия "Найти страницу в PDF"
      Image Modified
    3. Нажать на кнопку "Старт" в верхней панели. 

    ...

    Программный робот отработал успешно. Найдены страницы с данным текстом в документе.