Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Найти страницу в PDF Версия

...

11(Python)

Группа действий: Распознавание текста 

...

Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.

Иконка действия

Параметры

Входные параметры  

Путь к файлу             Путь к PDF-файлу, страница которого будет использована для распознавания

Основной язык         Язык, который распознаватель ожидает в тексте

Текст                          Текст, который должна содержать страница

Выходные параметры

Номер страницы   Переменная, которая будет содержать номера всех найденных страниц

Настройки

Параметры  и их настройки

СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлу

Путь к PDF-файлу, страница которого будет использована для распознавания

Путь к файлуC:\Users\Документы\1.pdfДа
Язык

Ожидаемый язык текста в PDF-файле


Выпадающий список из элементов

Основной язык

Язык, который распознаватель ожидает в тексте

По умолчанию значение равно "Русский"

Выпадающий список

Справочник содержит следующие значения

:

  • Русский
  • Английский
  • Вьетнамский
  • Арабский
Вьетнамский
  • Испанский
  • Португальский
  • Русский и английский
  • Вьетнамский и английский
  • Арабский и английский
  • Испанский и английский
    • Персидский
    • Турецкий
    • Казахский
    • Белорусский

    Значение по умолчанию – Русский

    Португальский и английский

    КоллекцияРусскийДаНет
    Текст

    Текст, который должна содержать искомая страница

    СтрокаЗагрузитьДа
    Дополнительный язык

    Дополнительный язык, необходимый для распознавания документа

    Выпадающий список из элементов:

    • Нет
    • Русский
    • Английский
    • Вьетнамский
    • Арабский
    • Испанский
    • Португальский
    • Индонезийский
    • Персидский
    • Турецкий
    • Казахский
    • Белорусский

    Значение по умолчанию – Нет

    Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык

    Строка
    Нет
    Обученная модель

    Файл с обученной моделью Tesseract в формате .taineddata.

    Позволяет загрузить собственную модель, натренированную на необходимые шрифты

    Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык"



    Нет
    Результаты
    Номер страницы

    Переменная, которая будет содержать номера всех найденных страницНомера страниц, на которых был найден искомый текст


    Если страница не будет найдена, то будет выведена ошибка: "Не найдена страница, содержащая заданный текст.

    Коллекция



    Особые условия использования

    ...

    Программный робот отработал успешно. Найдены страницы с данным текстом в документе.