Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Группа действий: Распознавание текста 

...

Описание

Действие выполняет распознавание текста на изображении и возвращает его в качестве результатапозволяет распознать и прочитать текст с изображения

Иконка действия 

Параметры

...

и их настройки

Входные параметры:  

Изображение                                                        Путь к файлу изображения. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff)

Ожидаемые языки текста на изображении        Ожидаемые языки текста на изображении

Параметры                                                            Параметры конфигурации для распознавания текста

Выходные параметры:

Результат                                                           Текст (string), который был получен из изображения

Настройки

СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры

Изображение

Путь к файлу изображенияPDF-файлу, страница которого будет использована для распознавания. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff)

Изображение

Область_текстаДа


Robin.FilePath
Да

Язык

Ожидаемый язык текста в PDF-файле

Ожидаемые языки текста на изображении

Ожидаемые языки текста на изображении

Выпадающий список из

значений

элементов:

  • Русский
язык
  • Английский
язык
  • Русский и английский язык
  • Испанский язык
  • Португальский язык
  • Вьетнамский
  • Арабский
  • СтрокаРусский язык
    • Вьетнамский
    • Арабский
    • Испанский
    • Португальский
    • Индонезийский
    • Персидский
    • Турецкий
    • Казахский
    • Белорусский

    Значение по умолчанию – Русский

    Robin.StringРусский языкДа

    Дополнительный язык

    Дополнительный язык, необходимый для распознавания документа.

    Выпадающий список из элементов:

    • Нет
    • Русский
    • Английский
    • Вьетнамский
    • Арабский
    • Испанский
    • Португальский
    • Индонезийский
    • Персидский
    • Турецкий
    • Казахский
    • Белорусский

    Значение по умолчанию – Нет

    Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык

    Если обученная модель не работает или плохо натренирована, то необходимо значения выпадающего списка "Язык" заменить, продублировав значения списка "Дополнительный язык".

    Robin.String
    НетДа

    Параметры

    Параметры конфигурации для распознавания текста

    https://muthu.co/all-tesseract-ocr-options/

    СтрокаRobin.String--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789Нет
    Обученная модель

    Файл с обученной моделью Tesseract в формате .taineddata.

    Позволяет загрузить собственную модель, натренированную на необходимые шрифты.

    Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык"




    Результаты
    Результат

    Текст (string), который был получен из изображения


    СтрокаRobin.String



    Особые условия использования

    ...