История страницы
...
Извлечение текста из файла с помощью сервиса Робин OCR с Сойкой
Второе действие из связки Отправить + Получить. Отправить файл на распознавание и Получить результат распознавания разделено на 2 действия для случаев, когда система будет долго обрабатывать большой файл, поданный на вход.
Настройки
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
URL | URL | Ссылка для аутентификации на сервисе Сойки. | Robin.String | http://localhost/administrator | Да |
Логин | Login | Логин для входа. | Robin.String | admin | Да |
Пароль | Password | Пароль для входа. | Robin.Password | admin | Да |
ID | ID | Идентификационный номер пакета | Robin.String | 65434 | Да |
Тип результата | Result type | Формат, в котором будут представлены результаты. Выпадающий список из элементов: XML, JSON. Значение по умолчанию: XML. | Robin.String | JSON | Нет |
Профиль распознавания | Profile | Профиль распознавания для получения результатов. Профили создаются в самой Сойке и пользователь заранее знает, какой необходимо выбрать. Значение по умолчанию задается системой при создании класса пакетов и называется default. | Robin.String | default | Нет |
Результаты | |||||
Результат | Result | Коллекция json-объектов или xml-контекстов, содержащих распознанные данные. Если распознание документа еще в процессе, то результат не заполнен. | Robin.Collection | ||
Статус | Status | Статус распознавания документа. | Robin.String |
Особые условия использования
Необходимо запустить действие "Отправить на распознавание" перед действием "Получить результат распознавания".
Чтобы получить результат, нужно чтобы файл был распознан системой и переведен в статус "export". Если робот при проверке статуса документа робот получил любой статус, кроме "export", то робот вернет полученный статус документа и пустой файл результата распознавания.
Робот вернет ошибку, если:
неверно указан путь, ссылка - 404
неверный логин или пароль подключения. 403
выбранный сценарий обработки не подходит. 401
внутренняя ошибка сервера -500.
личные данные и ID документа не принадлежат одному пользователю.
Робот НЕ вернет ошибку, если:
- на изображении не найден текст.
- на изображении не распознан текст.
статусы "quality control", "validation", который нужно менять вручную => вызвать rest api для перевода в другой модуль или открыть пакет на валидации, исправить ошибки и отправить его на экспорт.
Во всех этих случаях робот вернет пустой результат распознавания файла.
Если неверно указан язык текста, настроенный в алгоритме, то результатом, возможно, будет не пустая строка, совпадающие символы из алфавита.
Примеры использования
Отправить + получить
Задача: распознать текст на документе и сохранить возможность выполнять еще какие либо действия, пока происходит обработка поданного на вход документа.
...
- Последовательно установить действия «Отправить на распознавание» и "Получить результат распознавания" на рабочую область.
- Заполнить параметры действий корректными данными:
- параметры «Отправить на распознавание»;
- параметры "Получить результат распознавания".
- параметры «Отправить на распознавание»;
- Запустить робота по кнопке "Старт" в верхней панели.
...