Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Извлечение текста из файла с помощью сервиса Робин OCR с Сойкой

Второе действие из связки Отправить + Получить. Отправить файл на распознавание и Получить результат распознавания разделено на 2 действия для случаев, когда система будет долго обрабатывать большой файл, поданный на вход.

Image Modified

Настройки 

Свойство

Англ. наименование

Описание

Тип

Пример заполненияОбязательность заполнения поля
Параметры

URL

URLСсылка для аутентификации на сервисе Сойки.Robin.String http://localhost/administratorДа
Логин
Login

Логин для входа.

Robin.StringadminДа
ПарольPasswordПароль для входа.Robin.PasswordadminДа
ID

ID

Идентификационный номер пакетаRobin.String65434Да
Тип результатаResult type

Формат, в котором будут представлены результаты.



Выпадающий список из элементов: XML, JSON.

Значение по умолчанию: XML.

Robin.StringJSONНет
Профиль распознаванияProfileПрофиль распознавания для получения результатов.
Профили создаются в самой Сойке и пользователь заранее знает, какой необходимо выбрать. Значение по умолчанию задается системой при создании класса пакетов и называется default.
Robin.StringdefaultНет
Результаты

Результат

Result

Коллекция json-объектов или xml-контекстов, содержащих распознанные данные. Если распознание документа еще в процессе, то результат не заполнен.

Robin.Collection


СтатусStatusСтатус распознавания документа.Robin.String

Особые условия использования

Необходимо запустить действие "Отправить на распознавание" перед действием "Получить результат распознавания".

Чтобы получить результат, нужно чтобы файл был распознан системой и переведен в статус  "export". Если робот при проверке статуса документа робот получил любой статус, кроме "export", то робот вернет полученный статус документа и пустой файл результата распознавания.

Робот вернет ошибку, если:

  1. неверно указан путь, ссылка - 404

  2. неверный логин или пароль подключения. 403

  3. выбранный сценарий обработки не подходит. 401

  4. внутренняя ошибка сервера -500.

  5. личные данные и ID документа не принадлежат одному пользователю.

Робот НЕ вернет ошибку, если:

  • на изображении не найден текст.
  • на изображении не распознан текст.
  • статусы "quality control", "validation", который нужно менять вручную => вызвать rest api для перевода в другой модуль или открыть пакет на валидации, исправить ошибки и отправить его на экспорт.

Во всех этих случаях робот вернет пустой результат распознавания файла.

Если неверно указан язык текста, настроенный в алгоритме, то результатом, возможно, будет не пустая строка, совпадающие символы из алфавита.

Примеры использования

Отправить + получить

Задача: распознать текст на документе и сохранить возможность выполнять еще какие либо действия, пока происходит обработка поданного на вход документа.

...

  1. Последовательно установить действия «Отправить на распознавание» и  "Получить результат распознавания" на рабочую область.
  2. Заполнить параметры действий корректными данными:
    1. параметры  «Отправить на распознавание»; 

    2. параметры "Получить результат распознавания"
  3. Запустить робота по кнопке "Старт" в верхней панели. 

...