Прочитать текст Версия 10 (Python)
Группа действий: Распознавание текста
Описание
Действие выполняет распознавание текста на изображении и возвращает его в качестве результата
Иконка действия
Параметры
Входные параметры:
Изображение Путь к файлу изображения. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff)
Ожидаемые языки текста на изображении Ожидаемые языки текста на изображении
Формат контента Ожидаемый формат текста. Доступные форматы текста: (Line, Block, Page)
Параметры Параметры конфигурации для распознавания текста
Выходные параметры:
Результат Текст (string), который был получен из изображения
Настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|
Параметры | ||||
Изображение | Путь к файлу изображения. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff) | Изображение | Область_текста | Да |
Ожидаемые языки текста на изображении | Ожидаемые языки текста на изображении Выпадающий список из значений:
| Строка | Русский язык | Да |
Формат контента | Ожидаемый формат текста. Доступные форматы текста: (Line, Block, Page) Выпадающий список из значений:
| Строка | Строка | Да |
Параметры | Параметры конфигурации для распознавания текста | Строка | --psm 10 --oem 3 -c tessedit_char_whitelist=0123456789 | Нет |
Результаты | ||||
Результат | Текст (string), который был получен из изображения | Строка |
Особые условия использования
По умолчанию в поле "Параметры" используется режим --psm 3.
Все параметры перечисляются через пробел в формате --параметр значение_параметра.
Список всех параметров: https://muthu.co/all-tesseract-ocr-options/.
Параметр | Значение по умолчанию | Описание |
---|---|---|
Основные параметры | ||
oem | 3 |
|
psm | 3 |
|
Дополнительные параметры | ||
edges_min_nonhole | 14 | Минимальное число пикселей бокса для распознавания |
textord_space_size_is_variable | 0 | Если задано значение true (1), предполагается, что пробелы разделителей слов имеют переменную ширину, даже если символы имеют фиксированный шаг |
textord_tabfind_find_tables | 1 | Запустить детектирование таблиц |
textord_force_make_prop_words | 0 | Применить пропорциональную сегментацию слов во всех строках |
textord_width_limit | 8 | Максимальная ширина блоков для создания строк |
tessedit_pageseg_mode | 6 |
|
textord_max_noise_size | 7 | Максимальный размер шума в пикселях |
tessedit_dont_blkrej_good_wds | 0 | Если задано значение true (1), используется показатель качества сегментации слов |
tessedit_char_blacklist | Черный список символов, которые нельзя распознать | |
tessedit_char_whitelist | Белый список символов для распознавания | |
List of chars to override tessedit_char_blacklist | Список символов для переопределения tessedit_char_blacklist |
Пример использования
Задача
Прочитать текст на изображении
Решение
Воспользоваться действием "Прочитать текст"
Реализация
- Перенести действие "Прочитать текст" на рабочую область.
- Настроить параметры действия "Прочитать текст"
- Параметр "Изображение". Указать путь к файлу изображения, текст которого будет распознаваться.
- Параметр "Ожидаемые языки текста на изображении". Выбрать ожидаемые языки текса, находящегося на изображении. Для выбора доступны: "Русский язык", "Английский язык", "Русский и Английский язык", "Испанский язык", "Португальский язык". В данном случае - "Русский язык".
- Параметр "Формат контента". Выбрать ожидаемый формат текста. Для выбора доступны: "Строка", "Блок", "Страница". В данном случае - "Строка".
- "Результат". Текст, полученный в ходе распознавания текста из изображения. Записываем результат в переменную "Текст"
2. Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно. Текст считан с изображения.