Действия будут входить в отдельный продукт Robin OCR 1.0 и не относятся к студии стандартным сборкам студии.
Аутентификация
При первом подключении необходимо заходить через браузер, chrome предпочтительно. admin, admin.
Для получения доступа к функциям rest-сервиса требуется аутентификация – BasicHttpAuth, логин и пароль передаются в заголовке http, при этом логин в открытом виде, а пароль – зашифрованный MD5.
Можно сохранить учетную запись в браузере. у пользователя есть доступ только к определенным действиям, это настраивается при регистрации.
В двух вкладках открывают сразу же 2 модуля. Модуль администратора: http://localhost/administrator. Модуль валидации: http://localhost/validation.
Сессия подключения не существует, нужно подключать логин и пароль с каждым запросом.
- Личный логин и пароль пользователей связан с личными настроенными сценариями.
Документы
У пользователя будет создано 2 папки, импорт и экспорт, сколько угодно файлов в них.
Поддерживаемые форматы изображений: JPEG, PDF, TIFF, BMP, PNG, DOCX, GIF. При добавлении PDF или TIFF добавляются все страницы из документа.
Если в папке, поданной на вход в поле "Файл" подается неверный формат, то робот будет выдавать ошибку.
Если при распознавании произошла жёсткая ошибка, то упадёт обратно на импорт или отправится с модуль контроля качества.
Как работает
Нужно минимум 2 запроса, чтобы отправить документ. Сначала отправляется запрос на создание пакета, в запрос передается единственное изображение пакета или первое. Запрос возвращает GUID пакета. Если изображений в пакете должно быть несколько, то в последующих запросах эти изображения добавляются к пакету (по одному). Завершающим запросом надо запустить пакет на обработку. Во второй и последующие запросы передается GUID созданного пакета.
Можно поставить таймер и запрашивать статус по времени. Тогда лишаем пользователя возможности запускать процессы параллельно.
Формат результата настраивается заранее в сценарии.
Пользователь будет получать результат в виде коллекции с json/xml файлами.
Список классов пакета пользователь должен знать перед запуском действия.
Классы пакетов будут настроены в системе инженером, нужно выбрать класс, подходящий для обработки изображения. Имя класса пакета нужно указывать при создании пакета (обязательно). Имя класса пакета - это имя настроенного проекта. Имя пакета надо задавать в запросе. Можно в скрипте робота задавать имя как константу (то есть не пользователь выбирает, а задается в скрипте) , система будет переименовывать пакет, добавляя к имени индекс.
Когда робот будет завершать работу с ошибкой, в тексте ошибки нужно дополнительно выводить последний статус обработки документа.
Если статус документа не "export", то робот не сможет получить результат и пропустит документ. Пользователь сам должен будет передвинуть документ в другой статус на сервере.
Если в результате json-объект, то сможем ли мы обработать его действиями по работе с json. если нет, то возвращать строкой, содержащий текст в json-формате.
Интерфейс Сойки
Аутентификация
При первом подключении необходимо заходить через браузер, chrome предпочтительно. admin, admin.
Для получения доступа к функциям rest-сервиса требуется аутентификация – BasicHttpAuth, логин и пароль передаются в заголовке http, при этом логин в открытом виде, а пароль – зашифрованный MD5.
Можно сохранить учетную запись в браузере. у пользователя есть доступ только к определенным действиям, это настраивается при регистрации.
В двух вкладках открывают сразу же 2 модуля. Модуль администратора: http://localhost/administrator. Модуль валидации: http://localhost/validation.
Аутентификация при подключении через браузер - обязательная процедура для каждого пользователя. Личный логин и пароль пользователей связан с личными настроенными сценариями.
Просмотр и валидация документа
В режиме просмотра default с зажатой клавишей Shift можно выделить область, чтобы внести в нее правки.
Когда правки применены, изменения отражаются в системе.
Когда пользователь сохранил изменения, пакет документ был принят пользователем, статус документа изменился с "валидации" на "экспорт".
Файл прошел валидацию вручную.
Файл получил статус "Экспорт".
Способы обработки результата
Встроенные в студию действия по работе с JSON - файлами.
Пример составленной цепочки действий для обработки результата. Для распараллеливания процессов распознавания изображений можно использовать Очереди.
Представленные для текущего пользователя классы пакетов.
Профиль распознавания по умолчанию -default. Интерфейс настройки профиля распознавания.
Пример исходного файла.
Пример результирующего файла.
Составим последовательность действий, чтобы файл сохранился на компьютер.
Результат в виде json-файла. Нет необходимости сохранять полученный файл. Его можно сразу же обрабатывать действиями студии.
Действия студии, если результат получен в виде xml-файла. Далее можно воспользоваться действием "Получить элементы по XPath", чтобы получить необходимые для дальнейшей работы значения.