Вы просматриваете старую версию данной страницы. Смотрите текущую версию.

Сравнить с текущим просмотр истории страницы

« Предыдущий Версия 4 Следующий »

Прочитать текст / Read text


Данное действие предназначено для распознавания печатного текста в заданной области и сохранения распознанного текста в переменную.


Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
ИсточникSource

Путь к изображению для распознавания.

Допустимые расширения: ".jpeg", ".jpg", ".bmp", ".png", ".tif", ".tiff"


Если алгоритм не нашел расширение файла или тип файла неприменим, будет выведено предупреждение.

Изображение

Область_текстаДа
Основной языкPrimary language

Ожидаемый язык текста на изображении.


Выпадающий список:

Справочник содержит следующие значения:

  • Русский - Russian;
  • Английский - English;
  • Русский и Английский;

!!! Реализация списком временная.

После подготовки тулзы с возможностью выбрать несколько элементов одновременно (на базе типа Robin.Collection), тип параметра и реализация его ввода будут изменены.

СтрокаРусскийДа
Формат контентаSegmentation mode

Ожидаемый формат контента.


Выпадающий список:

  • Line - строка;
  • Block - блок;
  • Page - страница.

По умолчанию значение равно "Page".

!!! Параметр будет добавлен после того, как будет подготовлена программная реализация.

Строка

PageДа
Результаты
РезультатResult

Переменная, в которую будет сохранен распознанный текст.


Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение.

Строка



Особые условия использования

Отсутствуют.

Получить текст из PDF / Read text from PDF


Данное действие предназначено для распознавания текста из указанной страницы PDF документа и сохранения распознанного текста в переменную.


Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
ИсточникSource

Путь к PDF файлу для распознавания.


Если тип файла неприменим, будет выведено предупреждение.

Путь к файлу

C:\Users\Документы\1.pdfДа
Основной языкPrimary language

Языки, который распознаватель ожидает в тексте.


Выпадающий список:

Справочник содержит следующие значения:

  • Русский - Russian;
  • Английский - English;
  • Русский и Английский;

По умолчанию значение равно "Русский".

!!! Реализация списком временная.

После подготовки тулзы с возможностью выбрать несколько элементов одновременно (на базе типа Robin.Collection), тип параметра и реализация его ввода будут изменены.

СтрокаРусскийДа
Страница документа
Document page 

Номер станицы файла, с которой будет считываться текст.



Если документ не содержит указанной страницы, ошибки не будет, будет пустой результат.

Число2Да
Результаты
РезультатResult

Переменная, в которую будет сохранен распознанный текст.


Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение.

Строка



Особые условия использования

Отсутствуют.

Найти страницу в PDF / Find page in PDF


Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.


Настройки

СвойствоАнгл. наименованиеОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлуPath to file

Путь к PDF-файлу, страница которого будет использована для распознавания.

Путь к файлу C:\Users\Документы\1.pdfДа
Основной языкPrimary language

Язык, который распознаватель ожидает в тексте.

По умолчанию значение равно "Русский".


Выпадающий список.

Справочник содержит следующие значения:

  • Russian - русский;
  • English - английский;
  • Русский и Английский;

!!! После появления соответствующей тулзы, пользователь будет иметь возможность выбрать несколько языков.

КоллекцияРусскийДа
ТекстText

Текст, который должна содержать страница.

СтрокаЗагрузитьДа
Результаты
Номер страницыPage number

Переменная, которая будет содержать номера всех найденных страниц.


Если страница не будет найдена вывести ошибку: "Не найдена страница, содержащая заданный текст."

Коллекция



Особые условия использования

Отсутствуют.

  • Нет меток