Извлечь данные из документа Версия 3 (Python)

Группа действий: Распознавание текста


Описание

Действие извлекает поля с данными из указанного файла, в зависимости от выбранного типа документа.

Иконка действия

Параметры и их настройки

СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлуПуть к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, pngRobin.FilePath
Да
API-ключУникальный идентификатор для доступа к сервису DbrainRobin.String
Да
Облачный серверЕсли значение «true», то действие будет отправлять запрос на облачный сервер DBrain. Если «false», действие отправит запрос на локальный сервер DbrainRobin.BooleantrueНет
Тип документаТип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полейRobin.String
Да
Путь к папкеПуть к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле «Имя файла»Robin.FolderPathC:\doc\imgНет
Имя файлаНазвание изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле «Путь к папке»Robin.String
Нет
Тайм-аут, мсВремя в миллисекундах, в течение которого будет происходить извлечение данных из документа. Значение по умолчанию 120000 мсRobin.Numeric
Нет
ПерезаписатьЕсли «true», и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если «false», файл перезаписан не будет, и действие вернет ошибкуRobin.BooleantrueНет
Результаты
Извлеченные данныеСловарь, содержащий значения, извлеченные из исходного изображения. Список полей для каждого типа документов указаны в документации по платформеRobin.Dictionary

Изображение с блокамиПуть к изображению с наложенными блокамиRobin.FilePath

Точность распознаванияТочность распознавания каждого поля на изображении в диапазоне от 0 до 1. Ключ - имя поля, значение - точность распознавания данного поляRobin.Dictionary

Особые условия использования 

Подключение к Dbrain https://doc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku

Нейросеть распознает только российские документы.  

Для каждого вида документа определен набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым.  Ключи возвращаются на русском. 

Ключи для паспорта 2-3 стр.:

Ключи для прописки (5 стр):

Ключи для СНИЛС:

Робот вернет ошибку, если:

Пример использования 

Задача

Распознать поля с данными документа из файла.

Документ для распознания:

Решение

Воспользоваться действием "Извлечь данные из документа". 

Реализация

  1. Перенести действие  "Извлечь данные из документа" на рабочую область.
  2. Настроить параметры действия "Извлечь данные из документа".
  3. Нажать на кнопку "Старт"  в верхней панели.

Результат

Программный робот отработал успешно. Поля с данными распознаны.


Точность распознавания
Номер СНИЛС1
Фамилия1
Имя1
Отчество1
Дата рождения1
Место рождения1
Пол1
Дата регистрации1

Изображение с наложенными блоками: