История страницы
...
Для отправки документа на распознавание нужно выполнить минимум 2 запроса. Сначала отправляется запрос на создание пакета, в запрос передается единственное изображение пакета или первое. Запрос возвращает GUID пакета. Если изображений в пакете должно быть несколько, то в последующих запросах эти изображения добавляются к пакету (по одному). Завершающим запросом надо запустить пакет на обработку. Во второй и последующие запросы передается GUID созданного пакета.
Формат результата настраивается заранее, в сценарии.
Пользователь будет получать результат в виде коллекции json-объектов или xml-контекстов. С полученными результатами можно работать действиями студии.
Список классов пакета пользователь должен знать перед запуском действия.
Классы пакетов будут настроены в системе инженером, нужно выбрать класс, подходящий для обработки изображения. Имя класса пакета - это имя настроенного проекта. Имя класса пакета нужно указывать при создании пакета (обязательно). Имя пакета надо задавать в запросе.
Когда робот будет завершать работу с ошибкой, в тексте ошибки будет отображаться причина.
Если статус документа не "export", то робот не сможет получить результат и пропустит документ. Пользователь сам должен будет передвинуть документ в статус "экспорт" на сервере. Нужно провести валидацию файла вручную и отправить его на экспорт, путем внесения и принятия изменений в нем.
Статусы:
- import – импорт => ждать смены статуса;
- recognize – распознавание =>ждать смены статуса;
- validation – валидация=> вручную менять статус в системе Сойки;
- export – экспорт => готово к выгрузке, можно запускать действие "Получить статус распознавания";
- deleted - пакет был удален, ждать смены статуса;
- inaccessible - пакет недоступен, ждать смены статуса;
- quality control - если пользователь отправил по неправильному сценарию, вручную менять статус в системе Сойки.
- Если таймаут истекает до того как получим распознанный текст будет получен пустой результат, действие не завершается с ошибкой.
Извлечение текста из файла возможно с помощью сервиса Робин OCR с Сойкой.
Действие отправляет на проверку документы и сразу получает результаты:
- rest-сервис экспорта отвечает за получение результата;
- json или xml результат будет. Это настраивается внутри сценария обработки пакета в Сойке.;
- В действии надо вернуть не строку, а json-объект или сразу xml-контекст. у xml Xml контекст нужно закрывать, у json Json не надо;
- Документ предварительно должен быть выгружен модулем экспорта;
- Действие должно ожидать пока статус документа станет "export". Тогда только запускать получение результата.
...
Задача
Распознать текст на документе.
Решение
Использовать действие "Распознать".
Реализация
- Установить действие "Распознать и получить результат" на рабочую область.
Заполнить параметры действия корректными данными.
- Запустить робота по кнопке "Старт" в верхней панели.
Результат
Робот вернул обработанные файлы. Результат представлен в виде коллекции с json-объектами или xml-контекстами. Статус "export".