Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Общие принципы работы с ROBIN OCR:

  1. Для отправки документа на распознавание нужно выполнить минимум 2 запроса. Сначала  отправляется запрос на создание пакета, в запрос передается единственное изображение пакета или первое. Запрос возвращает GUID пакета. Если изображений в пакете должно быть несколько, то в последующих запросах эти изображения добавляются к пакету (по одному). Завершающим запросом надо запустить пакет на обработку. Во второй и последующие запросы передается GUID созданного пакета.

  2. Формат результата настраивается заранее, в сценарии.

  3. Пользователь будет получать результат в виде

  4. коллекции json
  5. коллекции json-объектов или xml-контекстов. С полученными результатами можно работать действиями студии.

  6. Список классов пакета пользователь должен знать перед запуском действия.

  7. Классы пакетов будут настроены в системе инженером, нужно выбрать класс, подходящий для обработки изображения. Имя класса пакета - это имя настроенного проекта. Имя класса пакета нужно указывать при создании пакета (обязательно). Имя пакета надо задавать в запросе. 

  8. Когда робот будет завершать работу с ошибкой, в тексте ошибки будет отображаться причина. 

  9. Если статус документа не "export", то робот не сможет получить результат и пропустит документ. Пользователь сам должен будет передвинуть документ

  10. в статус
  11. в статус "экспорт" на сервере. Нужно провести валидацию файла вручную и отправить его на экспорт, путем внесения и принятия изменений в нем.

  12. Статусы: 

    1. import – импорт =
  13. > ждать
    1. > ждать смены статуса
    2. recognize – распознавание =>ждать смены статуса
    3. validation – валидация=
  14. > вручную
    1. > вручную менять статус в системе Сойки
    2. export – экспорт => готово к выгрузке
    3. deleted - пакет был удален 
    4. inaccessible - пакет недоступен
    5. quality control -  если пользователь отправил по неправильному сценарию,
  15.  вручную
    1.  вручную менять статус в системе Сойки.
  16. Если таймаут истекает до того как получим распознанный текст будет получен пустой результат, действие не завершается с ошибкой.

Интерфейс Сойки. 

Аутентификация:

  1. При первом подключении необходимо заходить через браузер, chrome предпочтительно. admin, admin.

  2. Для получения доступа к функциям rest-сервиса требуется аутентификация – BasicHttpAuth, логин и пароль передаются в заголовке http, при этом логин в открытом виде, а пароль – зашифрованный MD5.

  3. Можно сохранить учетную запись в браузере. у пользователя есть доступ только к

  4. определенным
  5. определенным действиям, это настраивается при регистрации.

  6. В двух вкладках открывают сразу же 2 модуля. Модуль администратора: http://localhost/administrator. Модуль валидации: http://localhost/validation

 Аутентификация при подключении через браузер - обязательная процедура для каждого пользователя. Личный  Личный логин и пароль пользователей связан с личными настроенными сценариями.
Image Modified Image Modified

Просмотр и валидация документа. 
Image Modified

В режиме просмотра default с зажатой клавишей Shift можно выделить область, чтобы внести в нее правки. 

Когда правки применены, изменения отражаются в системе. 
Image Modified

Когда пользователь сохранил изменения, пакет документ был принят пользователем, статус документа изменился с "валидации" на "экспорт".

Файл прошел валидацию вручную. 
Image Modified

Файл получил статус "Экспорт".
Image Modified

Способы обработки результата

Встроенные в студию действия по работе с JSON - файлами.
Image Modified

Пример составленной цепочки действий для обработки результата. Для распараллеливания процессов распознавания изображений можно использовать Очереди. Image Modified

Представленные для текущего пользователя классы пакетов.
Image Modified

Профиль распознавания по распознавания по умолчанию -default. Интерфейс настройки профиля распознавания.
Image Modified

Пример исходного файла. 
Image Modified

Пример результирующего файла.

Составим последовательность действий, чтобы файл сохранился на компьютер.
Image Modified 

Результат в виде json-файла. Нет необходимости сохранять полученный файл. Его можно сразу же обрабатывать действиями студии.
Image Modified

Действия студии, если результат получен в виде xml-файла. Далее можно воспользоваться действием "Получить элементы по XPath", чтобы получить необходимые для дальнейшей работы значения.Image Modified

...