История страницы
...
Аутентификация при подключении через браузер - обязательная процедура для каждого пользователя. Личный логин и пароль пользователей связан с личными настроенными сценариями.
Просмотр и валидация документа.
В режиме просмотра default с зажатой клавишей Shift можно выделить область, чтобы внести в нее правки.
Когда правки применены, изменения отражаются в системе.
Когда пользователь сохранил изменения, пакет документ был принят пользователем, статус документа изменился с "валидации" на "экспорт".
...
Файл прошел валидацию вручную.
Файл получил статус "Экспорт".
Способы обработки результата.
Встроенные в студию действия по работе с JSON - файлами.
Пример составленной цепочки действий для обработки результата. Для распараллеливания процессов распознавания изображений можно использовать Очереди.
Представленные для текущего пользователя классы пакетов.
Профиль распознавания по умолчанию -default. Интерфейс настройки профиля распознавания.
Пример исходного файла.
Пример результирующего файла.
Составим последовательность действий, чтобы файл сохранился на компьютер.
Результат в виде json-файла. Нет необходимости сохранять полученный файл. Его можно сразу же обрабатывать действиями студии.
Действия студии, если результат получен в виде xml-файла. Далее можно воспользоваться действием "Получить элементы по XPath", чтобы получить необходимые для дальнейшей работы значения.
Действие "Отправить на распознавание" / "Send files for recognition"
...
Извлечение текста из файла файла изображения с использованием пред-настроенного профиля распознавания.
Настройки
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
URL | URL | Ссылка для аутентификации на сервисе Сойки. | Robin.String | http://localhost/administrator | Да |
Логин | Login | Логин для входа. | Robin.String | admin | Да |
Пароль | Password | Пароль для входа. | Robin.Password | admin | Да |
ID | ID | Идентификационный номер пакета | Robin.String | 65434 | Да |
Тип результата | Result type | Формат, в котором будут представлены результаты. Выпадающий список из элементов: XML, JSON. Значение по умолчанию: XML. | Robin.String | JSON | Нет |
Профиль распознавания | Profile | Профиль распознавания для получения результатов. Профили создаются в самой Сойке и пользователь заранее знает, какой необходимо выбрать. Значение по умолчанию задается системой при создании класса пакетов и называется default. | Robin.String | default | Нет |
Результаты | |||||
Результат | Result | Коллекция json-объектов или xml-контекстов, содержащих распознанные данные. Если распознание документа еще в процессе, то результат не заполнен. | Robin.Collection | ||
Статус | Status | Статус распознавания документа. |
...
Если за 120 секунд сервер не отправил ответ, то сервер недоступен.
Робот вернет ошибку, если:
неверно указан путь, ссылка - 404
неверный логин или пароль подключения. 403
выбранный сценарий обработки не подходит. 401
внутренняя ошибка сервера -500.
личные данные и ID документа не принадлежат одному пользователю.
Робот НЕ вернет ошибку, если:
- на изображении не найден текст.
- на изображении не распознан текст.
статусы "quality control", "validation", который нужно менять вручную => вызвать rest api для перевода в другой модуль или открыть пакет на валидации, исправить ошибки и отправить его на экспорт.
Во всех этих случаях робот вернет пустой результат распознавания файла.
Если неверно указан язык текста, настроенный в алгоритме, то результатом, возможно, будет не пустая строка, совпадающие символы из алфавита.
Действие "Распознать" / "Recognize files"
Извлечение текста из файла.
Настройки
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
URL | URL | Ссылка для аутентификации на сервисе Сойки. | Robin.String | http://localhost/administrator | Да |
Логин | Login | Логин для входа. | Robin.String | admin | Да |
Пароль | Password | Пароль для входа. | Robin.Password | admin | Да |
Класс пакета | Class | Класс пакета, которым будет обрабатываться сценарий. | Robin.String. | Имя класса пакета | Да |
Файл | File | Путь к файлу, из которого необходимо извлечь текст. Поддерживаемые форматы изображений: JPEG, PDF, TIFF, BMP, PNG, DOCX, GIF. | Robin.FilePath. | C:\Users\Документ\1.jpg | Да |
Тип результата | Result type | Формат, в котором будут представлены результаты. Выпадающий список из элементов: XML, JSON. Значение по умолчанию: XML. | Robin.String | JSON | Нет |
Профиль распознавания | Profile | Профиль распознавания для получения результатов. Профили создаются в самой Сойке и пользователь заранее знает, какой необходимо выбрать. Значение по умолчанию задается системой при создании класса пакетов и называется default. | Robin.String | default | Нет |
Тайм-аут | Time out | Время в миллисекундах, в течение которого будет происходить работа действия. | Robin.Numeric | 1000000 | Нет |
Результаты | |||||
Результат | Result | Коллекция json-объектов или xml-контекстов, содержащих распознанные данные. Если распознание документа еще в процессе, то результат не заполнен. | Robin.Collection | ||
Статус | Status | Статус распознавания документа. |
Особые условия использования
...
неверно указан путь, ссылка - 404
неверный логин или пароль подключения. 403
выбранный сценарий обработки не подходит. 401
внутренняя ошибка сервера -500.
личные данные и ID документа не принадлежат одному пользователю.
...