История страницы
Извлечь данные из документа
...
Версия 3 (Python)
Группа действий: Распознавание текста
...
Описание
Действие извлекает поля с данными из указанного файла, в зависимости от выбранного от выбранного типа документа.
Иконка действия
...
Параметры и их настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля | |||
Параметры | |||||||
Путь к файлу | Путь к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png | .Robin.FilePath | .C:\doc\img.pngДа | ||||
API-ключ | Уникальный идентификатор для доступа | к сервисук сервису Dbrain | .Robin.String | Да | |||
Облачный сервер | Если значение | "true"«true», то действие будет отправлять запрос на облачный сервер DBrain. Если | "false"«false», действие отправит запрос на локальный сервер Dbrain | .Robin.Boolean | true | Нет | |
Тип документа | Тип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полей | .Robin.String | Да | ||||
Путь к папке | Путь к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле | "Имя файла".«Имя файла» | Robin.FolderPath | C:\doc\ | Folderimg | Нет | |
Имя файла | Название изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле | "Путь к папке".«Путь к папке» | Robin.String | Нет | |||
Тайм-аут, мс | Время в миллисекундах, в течение которого будет происходить извлечение данных из документа. Значение по умолчанию 120000 мс | .Robin.Numeric | Нет | ||||
Перезаписать | Если | значение "true"«true», и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если | "false"«false», файл перезаписан не будет, и действие вернет ошибку | .Robin.Boolean | true | Нет | |
Результаты | |||||||
Извлеченные данные | Словарь, содержащий значения, извлеченные из исходного изображения. Список полей для каждого типа документов указаны в документации по платформе | .Robin.Dictionary | |||||
Изображение с блоками | Путь к изображению с наложенными блоками | .Robin.FilePath | |||||
Точность распознавания | Точность распознавания каждого поля на изображении в диапазоне от 0 до 1. | КлючКлюч - имя поля, значение - точность распознавания данного поля | .Robin.Dictionary |
Особые условия
...
использования
Подключение к Dbrain https://doc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku
Нейросеть распознает только российские документы.
Действие работает с конкретными видами документов: Снилс, первый разворот и прописка паспорта.
Для каждого вида документа есть определен набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым. Ключи возвращаются на русском.
Поля Ключи для паспорта 2-3 стр.:
- Паспорт выдан
- Дата выдачи
Код подразделения
Фамилия
Имя
Отчество
Пол
- Дата рождения
Место рождения
- Номер и серия паспорта
...
Ключи для прописки (5 стр):
...
заполнено поле "Путь к папке" и не заполнено "Имя файла".
заполнено поле "Имя файла" и не заполнено "Путь к файлу".
- в поле "Путь к файлу" подается недопустимый формат входного файла.
- по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.
- указан неверный API-ключ.
- Тайм-аут закончился, результат не получен.
Облачный сервер не отмечен, локальный сервер не развернут пользователем на машине.
Пример
...
использования
Задача
Распознать : распознать поля с данными документа из файла.
Документ для распознания:
Решение
Воспользоваться Решение: воспользоваться действием "Извлечь данные из документа".
Реализация
...
Документ для распознания:
- Перенести действие "Извлечь данные из документа" на рабочую область.
- Настроить параметры действия "Извлечь данные из документа".
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный : Программный робот отработал успешно. Поля Поля с данными распознаны.
Точность распознавания | |
---|---|
Номер СНИЛС | 1 |
Фамилия | 1 |
Имя | 1 |
Отчество | 1 |
Дата рождения | 1 |
Место рождения | 1 |
Пол | 1 |
Дата регистрации | 1 |
Изображение с наложенными блоками: