Общие принципы работы с ROBIN OCR 1.0 указаны в действии "Распознать".
Описание
Извлечение текста из файла с помощью сервиса Робин OCR с Сойкой
Второе действие из связки Отправить + Получить. Отправить файл на распознавание и Получить результат распознавания разделено на 2 действия для случаев, когда система будет долго обрабатывать большой файл, поданный на вход
URL Ссылка для аутентификации на сервисе Сойки
Логин Логин для входа
Пароль Пароль для входа
ID Идентификационный номер пакета
Тип результата Формат, в котором будут представлены результаты
Профиль распознавания Профиль распознавания для получения результатов
Результат Коллекция json-объектов или xml-контекстов, содержащих распознанные данные. Если распознание документа еще в процессе, то результат не заполнен
Статус Статус распознавания документа
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
URL | URL | Ссылка для аутентификации на сервисе Сойки | Robin.String | http://localhost/administrator | Да |
Логин | Login | Логин для входа | Robin.String | admin | Да |
Пароль | Password | Пароль для входа | Robin.Password | admin | Да |
ID | ID | Идентификационный номер пакета | Robin.String | 65434 | Да |
Тип результата | Result type | Формат, в котором будут представлены результаты Выпадающий список из элементов: XML, JSON Значение по умолчанию: XML | Robin.String | JSON | Нет |
Профиль распознавания | Profile | Профиль распознавания для получения результатов Профили создаются в самой Сойке и пользователь заранее знает, какой необходимо выбрать. Значение по умолчанию задается системой при создании класса пакетов и называется default | Robin.String | default | Нет |
Результаты | |||||
Результат | Result | Коллекция json-объектов или xml-контекстов, содержащих распознанные данные. Если распознание документа еще в процессе, то результат не заполнен | Robin.Collection | ||
Статус | Status | Статус распознавания документа | Robin.String |
Необходимо запустить действие "Отправить на распознавание" перед действием "Получить результат распознавания".
Чтобы получить результат, нужно чтобы файл был распознан системой и переведен в статус "export". Если робот при проверке статуса документа робот получил любой статус, кроме "export", то робот вернет полученный статус документа и пустой файл результата распознавания.
Робот вернет ошибку, если:
неверно указан путь, ссылка - 404
неверный логин или пароль подключения. 403
выбранный сценарий обработки не подходит. 401
внутренняя ошибка сервера -500.
личные данные и ID документа не принадлежат одному пользователю.
Робот НЕ вернет ошибку, если:
статусы "quality control", "validation", который нужно менять вручную => вызвать rest api для перевода в другой модуль или открыть пакет на валидации, исправить ошибки и отправить его на экспорт.
Во всех этих случаях робот вернет пустой результат распознавания файла.
Если неверно указан язык текста, настроенный в алгоритме, то результатом, возможно, будет не пустая строка, совпадающие символы из алфавита.
Задача: распознать текст на документе и сохранить возможность выполнять еще какие либо действия, пока происходит обработка поданного на вход документа.
Решение: использовать действия «Отправить на распознавание», "Получить результат распознавания".
Реализация:
Результат: Робот вернет обработанные файлы. Результат представлен в виде коллекции с json-объектами или xml-контекстами. Статус "export".