Прочитать текст Версия 11 (Python)
Группа действий: Распознавание текста
Описание
Действие позволяет распознать и прочитать текст с изображения.
Иконка действия
Параметры и их настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|
Параметры | ||||
Изображение | Путь к PDF-файлу, страница которого будет использована для распознавания. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff) | Robin.FilePath | Да | |
Язык | Ожидаемый язык текста в PDF-файле Выпадающий список из элементов:
Значение по умолчанию – Русский | Robin.String | Русский язык | Да |
Дополнительный язык | Дополнительный язык, необходимый для распознавания документа. Выпадающий список из элементов:
Значение по умолчанию – Нет Если в параметрах "Язык" и "Дополнительный язык" выбран один и тот же вариант, то ошибки не будет. Дубль будет считаться как 1 язык Если обученная модель не работает или плохо натренирована, то необходимо значения выпадающего списка "Язык" заменить, продублировав значения списка "Дополнительный язык". | Robin.String | Нет | |
Параметры | Параметры конфигурации для распознавания текста | Robin.String | --psm 10 --oem 3 -c tessedit_char_whitelist=0123456789 | |
Обученная модель | Файл с обученной моделью Tesseract в формате .taineddata. Позволяет загрузить собственную модель, натренированную на необходимые шрифты. Если параметр заполнен, то будет считаться приоритетнее, чем параметры "Язык" и "Дополнительный язык" | |||
Результаты | ||||
Результат | Текст (string), который был получен из изображения | Robin.String |
Особые условия использования
По умолчанию в поле "Параметры" используется режим --psm 3.
Все параметры перечисляются через пробел в формате --параметр значение_параметра.
Список всех параметров: https://muthu.co/all-tesseract-ocr-options/.
Параметр | Значение по умолчанию | Описание |
---|---|---|
Основные параметры | ||
oem | 3 |
|
psm | 3 |
|
Дополнительные параметры | ||
edges_min_nonhole | 14 | Минимальное число пикселей бокса для распознавания |
textord_space_size_is_variable | 0 | Если задано значение true (1), предполагается, что пробелы разделителей слов имеют переменную ширину, даже если символы имеют фиксированный шаг |
textord_tabfind_find_tables | 1 | Запустить детектирование таблиц |
textord_force_make_prop_words | 0 | Применить пропорциональную сегментацию слов во всех строках |
textord_width_limit | 8 | Максимальная ширина блоков для создания строк |
tessedit_pageseg_mode | 6 |
|
textord_max_noise_size | 7 | Максимальный размер шума в пикселях |
tessedit_dont_blkrej_good_wds | 0 | Если задано значение true (1), используется показатель качества сегментации слов |
tessedit_char_blacklist | Черный список символов, которые нельзя распознать | |
tessedit_char_whitelist | Белый список символов для распознавания | |
List of chars to override tessedit_char_blacklist | Список символов для переопределения tessedit_char_blacklist |
Пример использования
Задача
Прочитать текст на изображении.
Решение
Воспользоваться действием "Прочитать текст".
Реализация
- Перенести действие "Прочитать текст" на рабочую область.
- Настроить параметры действия "Прочитать текст":
- Параметр "Изображение". Указать путь к файлу изображения, текст которого будет распознаваться.
- Параметр "Ожидаемые языки текста на изображении". Выбрать ожидаемые языки текса, находящегося на изображении. Для выбора доступны: "Русский язык", "Английский язык", "Русский и Английский язык", "Испанский язык", "Португальский язык". В данном случае - "Русский язык".
- Параметр "Формат контента". Выбрать ожидаемый формат текста. Для выбора доступны: "Строка", "Блок", "Страница". В данном случае - "Строка".
- "Результат". Текст, полученный в ходе распознавания текста из изображения. Записываем результат в переменную "Текст".
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно. Текст считан с изображения.