История страницы
...
Группа действий: Распознавание текста
...
Описание
Действие выполняет распознавание текста на изображении и возвращает его в качестве результатапозволяет распознать и прочитать текст с изображения
Иконка действия
Параметры
...
и их настройки
Входные параметры:
Изображение Путь к файлу изображения. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff)
Ожидаемые языки текста на изображении Ожидаемые языки текста на изображении
Параметры Параметры конфигурации для распознавания текста
Выходные параметры:
Результат Текст (string), который был получен из изображения
Настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля | |||||
---|---|---|---|---|---|---|---|---|---|
Параметры | |||||||||
Изображение | Путь к файлу изображенияPDF-файлу, страница которого будет использована для распознавания. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff) | Изображение | Область_текста | Да | Robin.FilePath | Да | |||
Язык | Ожидаемый язык текста в PDF-файле | Ожидаемые языки текста на изображении | Ожидаемые языки текста на изображении Выпадающий список из значенийэлементов:
| Строка | Русский язык |
Значение по умолчанию – Русский | Robin.String | Русский язык | Да |
Дополнительный язык | Дополнительный язык, необходимый для распознавания документа. Выпадающий список из элементов:
Значение по умолчанию – Нет Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык Если обученная модель не работает или плохо натренирована, то необходимо значения выпадающего списка "Язык" заменить, продублировав значения списка "Дополнительный язык". | Robin.String | НетДа | ||||||
Параметры | Параметры конфигурации для распознавания текста | СтрокаRobin.String | --psm 10 --oem 3 -c tessedit_char_whitelist=0123456789Нет | ||||||
Обученная модель | Файл с обученной моделью Tesseract в формате .taineddata. Позволяет загрузить собственную модель, натренированную на необходимые шрифты. Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык" | ||||||||
Результаты | |||||||||
Результат | Текст (string), который был получен из изображения | СтрокаRobin.String |
Особые условия использования
...