Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Распознать Версия 2 (Net)

...

Описание

Извлечение текста из файла с помощью сервиса Робин OCR с СойкойДействие отправляет изображения в сервис SOICA и получает результаты распознавания

Иконка действия

Image Modified

Параметры

...

и их настройки

Входные параметры

URL                                              Ссылка для аутентификации на сервисе Сойки

Логин                                          Логин для входа

Пароль                                        Пароль для входа

Класс пакета                               Класс пакета, которым будет обрабатываться сценарий

Файл                                            Путь к файлу, из которого необходимо извлечь текст

Тип результата                           Формат, в котором будут представлены результаты

Профиль распознавания          Профиль распознавания для получения результатов

Тайм-аут                                     Время в миллисекундах, в течение которого действие будет ожидать ответ от сервиса SOICA

Выходные параметры

Результат                                   Коллекция json-объектов или xml-контекстов, содержащих распознанные данные

Статус                                         Статус распознавания документа

Настройки 

Свойство

Описание

Тип

Пример заполненияОбязательность заполнения поля
Параметры

URL

Ссылка для аутентификации на аутентификации в сервисе СойкиSOICARobin.String http://localhost/administratorДа
Логин

Логин для входа

Robin.StringadminДа
ПарольПароль для входаRobin.PasswordadminДа
Класс пакетаКласс пакета, которым будет обрабатываться сценарийRobin.String.Имя класса пакетаДа

Файл

Путь к файлу, из которого необходимо извлечь текст. Поддерживаемые форматы изображений: JPEGjpg, PDFpdf, TIFFtiff, BMPbmp, PNGpng, DOCXdocx, GIFgif

Robin.FilePath. 

C:\Users\Документ\1.jpgДа

Тип результата

Формат, в котором будут представлены результаты


Выпадающий список из элементов: XML, JSON

Значение по умолчанию: XML

Robin.StringJSONНет
Профиль распознавания

Профиль распознавания для получения результатов


Профили создаются в самой Сойке SOICA и пользователь заранее знает, какой необходимо выбрать. Значение по умолчанию задается системой при создании класса пакетов и называется default
Robin.StringdefaultНет
Тайм-аут, мсВремя в миллисекундах, в течение которого действие будет ожидать ответ от сервиса SOICARobin.Numeric1000000Нет
Результаты

Результат

Коллекция json-объектов или xml-контекстов, содержащих распознанные данные. Если истек указанный тайм-аут, а сервис не закончил распознавание, этот параметр вернется пустым.Если распознание документа еще в процессе, то результат не заполнен.

Robin.Collection

СтатусСтатус распознавания документаRobin.String

Особые условия использования

Общие принципы работы с ROBIN OCR

...

  1. Для отправки документа на распознавание нужно выполнить минимум 2 запроса. Сначала  отправляется запрос на создание пакета, в запрос передается единственное изображение пакета или первое. Запрос возвращает GUID пакета. Если изображений в пакете должно быть несколько, то в последующих запросах эти изображения добавляются к пакету (по одному). Завершающим запросом надо запустить пакет на обработку. Во второй и последующие запросы передается GUID созданного пакета.

  2. Формат результата настраивается заранее, в сценарии.

  3. Пользователь будет получать результат в виде коллекции json-объектов или xml-контекстов. С полученными результатами можно работать действиями студии.

  4. Список классов пакета пользователь должен знать перед запуском действия.

  5. Классы пакетов будут настроены в системе инженером, нужно выбрать класс, подходящий для обработки изображения. Имя класса пакета - это имя настроенного проекта. Имя класса пакета нужно указывать при создании пакета (обязательно). Имя пакета надо задавать в запросе. 

  6. Когда робот будет завершать работу с ошибкой, в тексте ошибки будет отображаться причина. 

  7. Если статус документа не "export", то робот не сможет получить результат и пропустит документ. Пользователь сам должен будет передвинуть документ в статус "экспорт" на сервере. Нужно провести валидацию файла вручную и отправить его на экспорт, путем внесения и принятия изменений в нем.

  8. Статусы: 

    1. import – импорт => ждать смены статуса;
    2. recognize – распознавание =>ждать смены статуса;
    3. validation – валидация=> вручную менять статус в системе Сойки;
    4. export – экспорт => готово к выгрузке, можно запускать действие "Получить статус распознавания";
    5. deleted - пакет был удален, ждать смены статуса;
    6. inaccessible - пакет недоступен, ждать смены статуса;
    7. quality control -  если пользователь отправил по неправильному сценарию, вручную менять статус в системе Сойки.
  9. Если таймаут истекает до того как получим распознанный текст будет получен пустой результат, действие не завершается с ошибкой.

...

  1. .

Действие отправляет на проверку документы и сразу получает результаты:

  • rest-сервис экспорта отвечает за получение результата;
  • json или xml результат будет. Это настраивается внутри сценария обработки пакета в Сойке.;
  • В действии надо вернуть не строку, а  json-объект или сразу xml-контекст.  у xml Xml контекст нужно закрывать, у json Json не надо;
  • Документ предварительно должен быть выгружен модулем экспорта;
  • Действие должно ожидать пока статус документа станет "export". Тогда только запускать получение результата.

Пример использования

Задача

Распознать текст на документе.

Решение

Использовать действие "Распознать". 

Реализация

  1. Установить действие "Распознать и получить результат" на рабочую область.
  2. Заполнить параметры действия корректными данными.  
    Image Modified

  3. Запустить робота по кнопке "Старт" в верхней панели. 
    Image Removed

Результат

Робот вернул обработанные файлы. Результат представлен в виде коллекции с  json-объектами или xml-контекстами. Статус "export".
Image Modified