Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Find page in PDF Version

...

11 (Python)

Action group: Text recognition 

...

PropertyDescriptionTypeFilling exampleMandatory field
Parameters
PDF file pathPath to PDF fileRobin.FilePath
Yes
TextThe text that the search page should containRobin.String
Yes
Expected languages Languages of text in the PDF file

Expected languages of text in the PDF file

Выпадающий список из элементов:

  • Русский
  • Английский
  • Вьетнамский
  • Арабский
  • Испанский
  • Португальский
  • Персидский
  • Турецкий
  • Казахский
  • Белорусский

Значение по умолчанию – Русский

Collection
No
Дополнительный язык

Дополнительный язык, необходимый для распознавания документа

Выпадающий список из элементов:

  • Нет
  • Русский
  • Английский
  • Вьетнамский
  • Арабский
  • Испанский
  • Португальский
  • Индонезийский
  • Персидский
  • Турецкий
  • Казахский
  • Белорусский

Значение по умолчанию – Нет

Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык

Robin.String
No
Обученная модель

Файл с обученной моделью Tesseract в формате .taineddata.

Позволяет загрузить собственную модель, натренированную на необходимые шрифты

Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык"



NoYes
Results
Page numbersPage numbers where search text was foundRobin.Collection

...