Прочитать текст / Read text
Группа действий: Распознавание текста
Действие выполняет распознавание текста на изображении и возвращает его в качестве результата
Параметры
Входные параметры:
Изображение - Путь к файлу изображения. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff)
Ожидаемые языки текста на изображении - Ожидаемые языки текста на изображении
Формат контента - Ожидаемый формат текста. Доступные форматы текста: (Line, Block, Page)
Параметры - Параметры конфигурации для распознавания текста.
Выходные параметры:
Возвращает текст (string), который был получен из изображения.
Настройки
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
Изображение | Image | Путь к файлу изображения. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff) | Изображение | Область_текста | Да |
Ожидаемые языки текста на изображении | Expected languages of text in the image | Ожидаемые языки текста на изображении Выпадающий список из значений:
| Строка | Русский язык | Да |
Формат контента | Content format | Ожидаемый формат текста. Доступные форматы текста: (Line, Block, Page) Выпадающий список из значений:
| Строка | Строка | Да |
Параметры | Options | Параметры конфигурации для распознавания текста | Строка | --psm 10 --oem 3 -c tessedit_char_whitelist=0123456789 | Нет |
Результаты | |||||
Результат | Result | Текст (string), который был получен из изображения | Строка |
Особые условия использования
По умолчанию в поле "Параметры" используется режим --psm 3. Все параметры перечисляются через пробел в формате --параметр значение_параметра. Список всех параметров: https://muthu.co/all-tesseract-ocr-options/.
Параметр | Значение по умолчанию | Описание |
---|---|---|
Основные параметры | ||
oem | 3 |
|
psm | 3 |
|
Дополнительные параметры | ||
edges_min_nonhole | 14 | Минимальное число пикселей бокса для распознавания |
textord_space_size_is_variable | 0 | Если задано значение true (1), предполагается, что пробелы разделителей слов имеют переменную ширину, даже если символы имеют фиксированный шаг |
textord_tabfind_find_tables | 1 | Запустить детектирование таблиц |
textord_force_make_prop_words | 0 | Применить пропорциональную сегментацию слов во всех строках |
textord_width_limit | 8 | Максимальная ширина блоков для создания строк |
tessedit_pageseg_mode | 6 |
|
textord_max_noise_size | 7 | Максимальный размер шума в пикселях |
tessedit_dont_blkrej_good_wds | 0 | Если задано значение true (1), используется показатель качества сегментации слов |
tessedit_char_blacklist | Черный список символов, которые нельзя распознать | |
tessedit_char_whitelist | Белый список символов для распознавания | |
List of chars to override tessedit_char_blacklist | Список символов для переопределения tessedit_char_blacklist |
Пример использования
Задача: прочитать текст на изображении
Решение: воспользоваться действием "Прочитать текст"
Реализация:
- Перенести действие "Прочитать текст" на рабочую область и настроить его параметры:
- Нажать на кнопку "Старт" в верхней панели.
Результат:
Программный робот отработал успешно. Текст считан с изображения.