Read text Version 10 (Python)

Группа действий: Распознавание текста

Описание

Действие выполняет распознавание текста на изображении и возвращает его в качестве результата

Иконка

Image Removed

Параметры

Входные параметры

Action group: Text recognition

...

Description

The action performs text recognition on the image and returns it as a result

Action icon

Image Added

Parameters

Input parameters

Image - Path to the image file. Supported image formats

Изображение - Путь к файлу изображения. Поддерживаемые форматы изображений

: (jpeg, jpg, bmp, png, tif, tiff)
Ожидаемые языки текста на изображении - Ожидаемые языки текста на изображении

Формат контента

Expected languages of text in the image - Expected languages of text in the image
Content format - Expected text format. Available text formats

- Ожидаемый формат текста. Доступные форматы текста

: (Line, Block, Page)
Параметры - Параметры конфигурации для распознавания текста.

Выходные параметры

Возвращает текст (string), который был получен из изображения.

Настройки

Options - Configuration options for text recognition

Output parameters

Result - Returns the text (string) that was derived from the image.

Settings

Property	Description	Type	Filling example	Mandatory field
Parameters
Image	Path to image file. Supported image formats

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поляПараметры

Изображение

Image

Путь к файлу изображения. Поддерживаемые форматы изображений

: (jpeg, jpg, bmp, png, tif, tiff)

Изображение

Область_текстаДаОжидаемые языки текста на изображении

Robin.Image	C:\doc\img.png	Yes
Expected languages of text in the image	Expected languages of text in the image

Ожидаемые языки текста на изображении

Выпадающий список из значений:

Русский язык
Английский язык
Испанский язык
Португальский язык
Арабский
Вьетнамский
Русский и английский язык
Вьетнамский и английский
Арабский и английский
Испанский и английский
Португальский и английский

СтрокаРусский языкДа

Robin.String		Yes
Content format	Expected text content format. Available text formats

Формат контента

Content format

Ожидаемый формат текста. Доступные форматы текста

: (Line, Block, Page)

Выпадающий список из значений:

Строка
Блок
Страница

Строка

СтрокаДа

Параметры

Options

Параметры конфигурации для распознавания текста

https://muthu.co/all-tesseract-ocr-options/

Строка--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789НетРезультатыРезультатResult

Текст (string), который был получен из изображения

Строка

Особые условия использования

По умолчанию в поле "Параметры" используется режим --psm 3.

Все параметры перечисляются через пробел в формате --параметр значение_параметра.

Results
Robin.String		Yes
Options	Configuration options for OCR)	Robin.String	No
Result	Text (string) recognized from image	Robin.String

Special conditions of use

The default mode in the "Parameters" field is --psm 3.

All parameters are listed with a space in the format --parameter value_parameter.

List of all parameters: Список всех параметров: https://muthu.co/all-tesseract-ocr-options/.

Parameter	Default value	Description
Main parameters
Параметр	Значение по умолчанию	Описание
Основные параметры
oem	3	0: Использовать только устаревший движок tesseractUse only the outdated tesseract engine 1: Использовать только нейросеть LSTMUse only the LSTM neural network 2: Использовать одновлеменно старый движок tesseract и нейросеть LSTMUse the old tesseract engine and the LSTM neural network at the same time 3: Значение по умолчанию, используется то, что доступноDefault value, what is available is used
psm	3	0: Обнаружение только ориентации и сценария Orientation and Scenario Detection Only (OSD) 1: Автоматическая сегментация страниц с помощью экранного менюAutomatic page segmentation using the OSD menu 2: Автоматическая сегментация страниц, но без OSD или Automatic page segmentation, but no OSD or OCR 3: Полностью автоматическая сегментация страниц, но без экранного меню 4: Предположительно, что в тексте один столбец переменных размеров 5: Предположительно, что текст - это единый однородный блок вертикально выровненного текста 6: Изображение рассматривается как один единый блок текста 7: Изображение рассматривается как одна текстовая строка 8: Изображение рассматривается как одно слово 9: Изображение рассматривается как одно слово в круге 10: Изображение рассматривается как один символ 11: Разреженный текст. Поиск как можно больше текста в произвольном порядке 12: Разреженный текст с экранным меню 13: Необработанная строка. Изображение рассматривается как одна текстовая строка, минуя хаки, специфичные для Tesseract Fully automatic page segmentation, but no on-screen menus 4: Assume that the text has one column of variable sizes 5: Assume that the text is a single homogeneous block of vertically aligned text 6: The image is treated as one single block of text 7: The image is treated as a single text string 8: The image is treated as a single word 9: The image is treated as one word in a circle 10: The image is treated as a single symbol 11: Sparse text. Search for as much text as possible in random order 12: Sparse text with on-screen menus 13: Unprocessed string. The image is treated as a single text string, bypassing Tesseract-specific hacks
Additional parametersДополнительные параметры
edges_min_nonhole	14Минимальное число пикселей бокса для распознавания	Minimum number of box pixels to recognize
textord_space_size_is_variable	0Если	задано значение If true (1) , предполагается, что пробелы разделителей слов имеют переменную ширину, даже если символы имеют фиксированный шагis set, word delimiter spaces are assumed to be of variable width, even if the characters are of fixed pitch
textord_tabfind_find_tables	1Запустить детектирование таблиц	Launch table detection
textord_force_make_prop_words	0Применить пропорциональную сегментацию слов во всех строках	Apply proportional word segmentation to all strings
textord_width_limit	8Максимальная ширина блоков для создания строк	Maximum width of blocks for creating rows
tessedit_pageseg_mode	6	0: Только обноружение ориентации и сценарияOrientation and scenario detection only 1: Автоматический режим + обнаружение ориентацииAuto mode + orientation detection 2: Автоматический режим Auto mode 3: Обнаружение столбцовColumn detection 4: Обнаружение блоковBlock detection 5: Обнаружение строкString detection 6: Обнаружение словWord detection 7: Обнаружение символовSymbol detection
textord_max_noise_size	7Максимальный размер шума в пикселях	Maximum noise size in pixels
tessedit_dont_blkrej_good_wds	0	Если задано значение If true (1) , используется показатель качества сегментации словis set, the word segmentation quality score is used
tessedit_char_blacklistЧерный		список символов, которые нельзя распознатьBlacklisting characters that cannot be recognized
tessedit_char_whitelistБелый		список символов для распознаванияWhite list of characters to recognize
List of chars to override tessedit_char_blacklist		Список символов для переопределения List of symbols to override tessedit_char_blacklist

Пример использования

Задача

Example of use

Task

Read the text in the image Прочитать текст на изображении

...

Solution

Воспользоваться действием "Прочитать текст"

Реализация

Use the "Read text" action

Implementation

Transfer the "Read text" action to the workspaceПеренести действие "Прочитать текст" на рабочую область.
Настроить параметры действия "Прочитать текст"
1. Параметр "Изображение". Указать путь к файлу изображения, текст которого будет распознаваться.
2. Параметр "Ожидаемые языки текста на изображении". Выбрать ожидаемые языки текса, находящегося на изображении. Для выбора доступны: "Русский язык", "Английский язык", "Русский и Английский язык", "Испанский язык", "Португальский язык". В данном случае - "Русский язык".
3. Параметр "Формат контента". Выбрать ожидаемый формат текста. Для выбора доступны: "Строка", "Блок", "Страница". В данном случае - "Строка".
4. "Результат". Текст, полученный в ходе распознавания текста из изображения. Записываем результат в переменную "Текст"

Image Removed

2. Нажать на кнопку "Старт" в верхней панели.

Результат

Set the parameters of the "Read text" action
1. "Image" parameter. Specify the path to the image file, the text of which will be recognized.
2. Parameter "Expected languages of text in the image". Select the expected languages of the text in the image. The following languages are available for selection: "Russian language", "English language", "Russian and English language", "Spanish language", "Portuguese language". In this case, it is "Russian language".
3. "Content format" parameter. Select the expected text format. The following are available for selection: "Line", "Block", "Page". In this case - "Line".
4. "Result". The text obtained during text recognition from the image. Write the result to the "Text" variable.

Image Added

2. Click on the "Start" button in the top panel.

Result

The program robot completed successfully. The text is read from the imageПрограммный робот отработал успешно. Текст считан с изображения.

Дерево страниц

Сравнение версий

Старая версия 3

Новая версия 4

Ключ

Read text Version 10 (Python)

Описание

Иконка

Параметры

Входные параметры

Description

Action icon

Parameters

Input parameters

Выходные параметры

Настройки

Output parameters

Settings

Особые условия использования

Special conditions of use

Пример использования

Задача

Example of use

Task

Solution

Реализация

Implementation

Дерево страниц

История страницы

Сравнение версий

Старая версия 3

Новая версия 4

Ключ

Read text Version 10 (Python)

Описание

Иконка

Параметры

Входные параметры

Description

Action icon

Parameters

Input parameters

Выходные параметры

Настройки

Output parameters

Settings

Особые условия использования

Special conditions of use

Пример использования

Задача

Example of use

Task

Solution

Реализация

Implementation