Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Read text Version 11 (Python)

Группа действий: Распознавание текста 

Описание

Действие выполняет распознавание текста на изображении и возвращает его в качестве результата

Иконка

Image Removed

Параметры

Входные параметры

...

Action group: Text recognition

...

Description

The action performs text recognition on the image and returns it as a result

Action icon

Image Added

Settings

PropertyDescriptionTypeFilling exampleMandatory field
Parameters
ImagePath to image file. Supported image formats: (jpeg, jpg, bmp, png, tif, tiff)

...

Ожидаемые языки текста на изображении - Ожидаемые языки текста на изображении

...

Формат контента - Ожидаемый формат текста. Доступные форматы текста: (Line, Block, Page)

...

Параметры - Параметры конфигурации для распознавания текста.

Robin.ImageC:\doc\img.pngYes
Expected languages of text in the image

Expected languages of text in the image

Expected languages of the text in the PDF file

A dropdown list of items:

  • Russian
  • English
  • Vietnamese
  • Arabic
  • Spanish
  • Portuguese
  • Indonesian
  • Persian
  • Turkish
  • Kazakh
  • Belarusian

Default value - Russian

Robin.String
Yes
Additional language

An additional language required for document recognition

A dropdown list of items:

  • No
  • Russian
  • English
  • Vietnamese
  • Arabic
  • Spanish
  • Portuguese
  • Indonesian
  • Persian
  • Turkish
  • Kazakh
  • Belarusian

The default value is No

If the same option is selected in the "Language" and "Additional Language" parameters, there will be no error. The duplicate will be counted as 1 language

Robin.Collection
No
Content formatExpected text content format. Available text formats

Выходные параметры

Возвращает текст (string), который был получен из изображения.

Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поляПараметры

Изображение

Image

Путь к файлу изображения. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff)

Изображение

Область_текстаДа

Ожидаемые языки текста на изображении

Expected languages of text in the image

Ожидаемые языки текста на изображении

Выпадающий список из значений:

  • Русский язык
  • Английский язык
  • Русский и Английский язык
  • Испанский язык
  • Португальский язык
СтрокаРусский языкДаФормат контента

Content format

Ожидаемый формат текста. Доступные форматы текста
: (Line, Block, Page)

Выпадающий список из значений:

  • Строка
  • Блок
  • Страница

Строка

СтрокаДа

Параметры

Options

Параметры конфигурации для распознавания текста

https://muthu.co/all-tesseract-ocr-options/

Строка--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789НетРезультатыРезультатResult

Текст (string), который был получен из изображения

Строка

Особые условия использования

По умолчанию в поле "Параметры" используется режим --psm 3.

Все параметры перечисляются через пробел в формате --параметр значение_параметра.

Robin.String
Yes
Trained model

Tesseract trained model file in .taineddata format.

Allows you to load your own model trained on the required fonts.

If the parameter is populated, it will be prioritized over the "Language" and "Additional language" parameters




OptionsConfiguration options for OCR)Robin.String
No
Results
ResultText (string) recognized from imageRobin.String

Special conditions of use

The default mode in the "Parameters" field is --psm 3.

All parameters are listed with a space in the format --parameter value_parameter.

List of all parameters: Список всех параметров: https://muthu.co/all-tesseract-ocr-options/.

ParameterDefault valueDescription
Main parameters
ПараметрЗначение по умолчаниюОписаниеОсновные параметры
oem3
  • 0:
Использовать только устаревший движок tesseract
  • Use only the outdated tesseract engine
  • 1:
Использовать только нейросеть LSTM
  • Use only the LSTM neural network
  • 2:
Использовать одновлеменно старый движок tesseract и нейросеть LSTM
  • Use the old tesseract engine and the LSTM neural network at the same time
  • 3:
Значение по умолчанию, используется то, что доступно
  • Default value, what is available is used
psm3
  • 0:

Обнаружение только ориентации и сценария
  • Orientation and Scenario Detection Only (OSD)

  • 1:

Автоматическая сегментация страниц с помощью экранного меню
  • Automatic page segmentation using the OSD menu

  • 2:

Автоматическая сегментация страниц, но без OSD или
  • Automatic page segmentation, but no OSD or OCR

  • 3:

Полностью автоматическая сегментация страниц, но без экранного меню
  • 4: Предположительно, что в тексте один столбец переменных размеров

  • 5: Предположительно, что текст - это единый однородный блок вертикально выровненного текста

  • 6: Изображение рассматривается как один единый блок текста

  • 7: Изображение рассматривается как одна текстовая строка

  • 8: Изображение рассматривается как одно слово

  • 9: Изображение рассматривается как одно слово в круге

  • 10: Изображение рассматривается как один символ

  • 11: Разреженный текст. Поиск как можно больше текста в произвольном порядке

  • 12: Разреженный текст с экранным меню

  • 13: Необработанная строка. Изображение рассматривается как одна текстовая строка, минуя хаки, специфичные для Tesseract

    • Fully automatic page segmentation, but no on-screen menus

    • 4: Assume that the text has one column of variable sizes

    • 5: Assume that the text is a single homogeneous block of vertically aligned text

    • 6: The image is treated as one single block of text

    • 7: The image is treated as a single text string

    • 8: The image is treated as a single word

    • 9: The image is treated as one word in a circle

    • 10: The image is treated as a single symbol

    • 11: Sparse text. Search for as much text as possible in random order

    • 12: Sparse text with on-screen menus

    • 13: Unprocessed string. The image is treated as a single text string, bypassing Tesseract-specific hacks

    Additional parameters
    Дополнительные параметры
    edges_min_nonhole14
    Минимальное число пикселей бокса для распознавания
    Minimum number of box pixels to recognize
    textord_space_size_is_variable0
    Если задано значение
    If true (1)
    , предполагается, что пробелы разделителей слов имеют переменную ширину, даже если символы имеют фиксированный шаг
    is set, word delimiter spaces are assumed to be of variable width, even if the characters are of fixed pitch
    textord_tabfind_find_tables1
    Запустить детектирование таблиц
    Launch table detection
    textord_force_make_prop_words0
    Применить пропорциональную сегментацию слов во всех строках
    Apply proportional word segmentation to all strings
    textord_width_limit8
    Максимальная ширина блоков для создания строк
    Maximum width of blocks for creating rows
    tessedit_pageseg_mode6
    • 0:

    Только обноружение ориентации и сценария
    • Orientation and scenario detection only

    • 1:

    Автоматический режим + обнаружение ориентации
    • Auto mode + orientation detection

    • 2:

    Автоматический режим
    • Auto mode

    • 3:

    Обнаружение столбцов
    • Column detection

    • 4:

    Обнаружение блоков
    • Block detection

    • 5:

    Обнаружение строк
    • String detection

    • 6:

    Обнаружение слов
    • Word detection

    • 7:

    Обнаружение символов
    • Symbol detection

    textord_max_noise_size7
    Максимальный размер шума в пикселях
    Maximum noise size in pixels
    tessedit_dont_blkrej_good_wds0
    Если задано значение
    If true (1)
    , используется показатель качества сегментации слов
    is set, the word segmentation quality score is used
    tessedit_char_blacklist
    Черный список символов, которые нельзя распознать

    Blacklisting characters that cannot be recognized
    tessedit_char_whitelist
    Белый список символов для распознавания

    White list of characters to recognize
    List of chars to override tessedit_char_blacklist
    Список символов для переопределения

    List of symbols to override tessedit_char_blacklist

    Пример использования

    Задача

    Example of use

    Task

    Read the text in the image Прочитать текст на изображении 


    ...

    Solution

    Воспользоваться действием "Прочитать текст"

    Реализация

    Use the "Read text" action

    Implementation

    1. Transfer the "Read text" action to the workspaceПеренести действие "Прочитать текст" на рабочую область.
    2. Настроить параметры действия "Прочитать текст"
      1. Параметр "Изображение". Указать путь к файлу изображения, текст которого будет распознаваться.
      2. Параметр "Ожидаемые языки текста на изображении". Выбрать ожидаемые языки текса, находящегося на изображении. Для выбора доступны: "Русский язык", "Английский язык", "Русский и Английский язык", "Испанский язык", "Португальский язык". В данном случае - "Русский язык".
      3. Параметр "Формат контента". Выбрать ожидаемый формат текста. Для выбора доступны: "Строка", "Блок", "Страница". В данном случае - "Строка".
      4. "Результат". Текст, полученный в ходе распознавания текста из изображения. Записываем результат в переменную "Текст"

    Image Removed

    2. Нажать на кнопку "Старт" в верхней панели. 

    Результат

    1. Set the parameters of the "Read text" action
      1. "Image" parameter. Specify the path to the image file, the text of which will be recognized.
      2. Parameter "Expected languages of text in the image". Select the expected languages of the text in the image. The following languages are available for selection: "Russian language", "English language", "Russian and English language", "Spanish language", "Portuguese language". In this case, it is "Russian language".
      3. "Content format" parameter. Select the expected text format. The following are available for selection: "Line", "Block", "Page". In this case - "Line".
      4. "Result". The text obtained during text recognition from the image. Write the result to the "Text" variable.

    Image Added

    2. Click on the "Start" button in the top panel. 

    Result

    The program robot completed successfully. The text is read from the imageПрограммный робот отработал успешно. Текст считан с изображения.