Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Данное действие предназначено для распознавания печатного текста в заданной области и сохранения распознанного текста в переменную.

(предупреждение) Переместить в подгруппу Tesseract группы Распознавание текста

Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
ИсточникSource

Путь к изображению для распознавания.

Допустимые расширения: ".jpeg", ".jpg", ".bmp", ".png", ".tif", ".tiff"


Если алгоритм не нашел расширение файла или тип файла неприменим, будет выведено предупреждение.

Robin.Image

Область_распознаванияДа
Основной языкPrimary language

Ожидаемый язык текста на изображении.


Выпадающий список:

Справочник содержит следующие значения:

  • Русский - Russian;
  • Английский - English;
  • Русский и Английский;

!!! Реализация списком временная.

После подготовки тулзы с возможностью выбрать несколько элементов одновременно (на базе типа Robin.Collection), тип параметра и реализация его ввода будут изменены.

Robin.StringРусскийДа
Формат контентаSegmentation mode

Ожидаемый формат контента.


Выпадающий список:

  • Line - строка;
  • Block - блок;
  • Page - страница.

По умолчанию значение равно "Page".

!!! Параметр будет добавлен после того, как будет подготовлена программная реализация.

Robin.String

PageДа
Результаты
РезультатResult

Переменная, в которую будет сохранен распознанный текст.


Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение.

Robin.String

Результат_распознавания_текста

...

Данное действие предназначено для распознавания текста из указанной страницы PDF документа и сохранения распознанного текста в переменную.

 Переместить в подгруппу Tesseract группы Распознавание текста

Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
ИсточникSource

Путь к PDF файлу для распознавания.


Если тип файла неприменим, будет выведено предупреждение.

Robin.Filepath

Область_распознаванияДа
Основной языкPrimary language

Языки, который распознаватель ожидает в тексте.


Выпадающий список:

Справочник содержит следующие значения:

  • Русский - Russian;
  • Английский - English;
  • Русский и Английский;

По умолчанию значение равно "Русский".

!!! Реализация списком временная.

После подготовки тулзы с возможностью выбрать несколько элементов одновременно (на базе типа Robin.Collection), тип параметра и реализация его ввода будут изменены.

Robin.StringРусскийДа
Страница документа
Document page 

Номер станицы файла, с которой будет считываться текст.



Если документ не содержит указанной страницы, ошибки не будет, будет пустой результат.

Robin.Numeric2Да
Результаты
РезультатResult

Переменная, в которую будет сохранен распознанный текст.


Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение.

Robin.String

Результат_распознавания_текста

...

Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.

 Переместить в подгруппу Tesseract группы Распознавание текста

Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлуPath to file

Путь к PDF-файлу, страница которого будет использована для распознавания.

Robin.FilepathC:\Users\RLABUTIN\Desktop\ Действия в Studio.pdfДа
Основной языкPrimary language

Язык, который распознаватель ожидает в тексте.

По умолчанию значение равно "Русский".


Выпадающий список.

Справочник содержит следующие значения:

  • Russian - русский;
  • English - английский;
  • Русский и Английский;

!!! После появления соответствующей тулзы, пользователь будет иметь возможность выбрать несколько языков.

Robin.CollectionРусскийДа
ТекстText

Текст, который должна содержать страница.

Robin.StringЗагрузитьДа
Результаты
Номер страницыPage number

Переменная, которая будет содержать номера всех найденных страниц.


Если страница не будет найдена вывести ошибку: "Не найдена страница, содержащая заданный текст."

Robin.Collection

Результат

...