Группа действий: Распознавание текста
Действие извлекает данные из документов (Паспорт 2-3стр., Паспорт 5стр., СНИЛС) и сохраняет их в виде словаря, содержащего извлеченные данные документа, и изображение с блоками, из которых брались эти данные. Для извлечения данных действие использует сервисы Dbrain, поэтому для его работы потребуется API-ключ вендора.
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Путь к файлу | Путь к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png. | Robin.FilePath. | C:\doc\img.png | Да |
API ключ | Уникальный идентификатор для доступа к сервису Dbrain. | Robin.String | Да | |
Облачный сервер | Если значение "true", то действие будет отправлять запрос на облачный сервер DBrain. Если "false", действие отправит запрос на локальный сервер Dbrain. | Robin.Boolean | true | Нет |
Тип документа | Тип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полей. Выпадающий список из элементов:
| Robin.String | Да | |
Путь к папке | Путь к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле "Имя файла". | Robin.FolderPath | C:\doc\Folder | Нет |
Имя файла | Название изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле "Путь к папке". | Robin.String | Нет | |
Тайм-аут, мс | Время в миллисекундах, в течение которого будет происходить извлечение данных из документа. Значение по умолчанию 120000 мс. | Robin.Numeric | Нет | |
Перезаписать | Если значение "true", и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если "false", файл перезаписан не будет, и действие вернет ошибку. | Robin.Boolean | true | Нет |
Результаты | ||||
Извлеченные данные | Словарь, содержащий значения, извлеченные из исходного изображения, где ключ - наименование поля, а значение - данные из соответствующих значению полей. Список полей для каждого типа документов указаны в особых условиях использования действия. | Robin.Dictionary | ||
Изображение с блоками | Путь к изображению с наложенными блоками. | Robin.FilePath | ||
Точность распознавания | Точность распознавания каждого поля на изображении в диапазоне от 0 до 1. Ключ - имя поля, значение - точность распознавания данного поля. | Robin.Dictionary |
Подключение к Dbrain https://doc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku
Нейросеть распознает только российские документы.
Для каждого вида документа определен набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым. Ключи возвращаются на русском.
Ключи для паспорта 2-3 стр.:
Код подразделения
Фамилия
Имя
Отчество
Пол
Место рождения
Ключи для прописки (5 стр):
Ключи для СНИЛС:
Робот вернет ошибку, если:
заполнено поле "Путь к папке" и не заполнено "Имя файла".
заполнено поле "Имя файла" и не заполнено "Путь к файлу".
Облачный сервер не отмечен, локальный сервер не развернут пользователем на машине.
Задача: распознать поля с данными документа из файла.
Решение: воспользоваться действием "Извлечь данные из документа".
Реализация:
Документ для распознания:
Результат: Программный робот отработал успешно. Поля с данными распознаны.
Точность распознавания | |
---|---|
Номер СНИЛС | 1 |
Фамилия | 1 |
Имя | 1 |
Отчество | 1 |
Дата рождения | 1 |
Место рождения | 1 |
Пол | 1 |
Дата регистрации | 1 |
Изображение с наложенными блоками: