Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Извлечь данные из документа

...

Версия 3 (Python)

Группа действий: Распознавание текста

...

Описание

Действие извлекает данные из документов (Паспорт 2-3стр., Паспорт 5стр., СНИЛС) и сохраняет их в виде словаря, содержащего извлеченные данные документа, и изображение с блоками, из которых брались эти данные. Для извлечения данных действие использует сервисы Dbrain, поэтому для его работы потребуется API-ключ вендора.

Image Removed

...

поля с данными из указанного файла, в зависимости от выбранного типа документа.

Иконка действия

Image Added

Параметры и их настройки

..C:\doc\img.png к сервису . "true" "false".. "Имя файла".Folder "Путь к папке".. значение "true" "false"., где ключ - наименование поля, а значение - данные из соответствующих значению полей особых условиях использования действия.. Ключ .
СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлуПуть к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, pngRobin.FilePath
Да
API-ключУникальный идентификатор для доступа к сервису DbrainRobin.String
Да
Облачный серверЕсли значение «true», то действие будет отправлять запрос на облачный сервер DBrain. Если «false», действие отправит запрос на локальный сервер DbrainRobin.BooleantrueНет
Тип документаТип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полей

Выпадающий список из элементов:

  • Паспорт 2-3стр.
  • Паспорт 5стр.
  • СНИЛС
Robin.String
Да
Путь к папкеПуть к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле «Имя файла»Robin.FolderPathC:\doc\imgНет
Имя файлаНазвание изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле «Путь к папке»Robin.String
Нет
Тайм-аут, мсВремя в миллисекундах, в течение которого будет происходить извлечение данных из документа. Значение по умолчанию 120000 мсRobin.Numeric
Нет
ПерезаписатьЕсли «true», и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если «false», файл перезаписан не будет, и действие вернет ошибкуRobin.BooleantrueНет
Результаты
Извлеченные данныеСловарь, содержащий значения, извлеченные из исходного изображения. Список полей для каждого типа документов указаны в документации по платформеRobin.Dictionary

Изображение с блокамиПуть к изображению с наложенными блокамиRobin.FilePath

Точность распознаванияТочность распознавания каждого поля на изображении в диапазоне от 0 до 1. Ключ - имя поля, значение - точность распознавания данного поляRobin.Dictionary

Особые условия

...

использования 

Подключение к Dbrain https://doc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku

...

  • заполнено поле "Путь к папке" и не заполнено "Имя файла".

  • заполнено поле "Имя файла" и не заполнено "Путь к файлу".

  • в поле "Путь к файлу" подается недопустимый формат входного файла.
  • по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.
  • указан неверный API-ключ.
  • Тайм-аут закончился, результат не получен.
  • Облачный сервер не отмечен, локальный сервер не развернут пользователем на машине.

Пример

...

использования 

Задача

Распознать : распознать поля с данными документа из файла.

Документ для распознания:
Image Added

Решение

Воспользоваться : воспользоваться действием "Извлечь данные из документа". 

Реализация

...

Документ для распознания:

Image Removed

  1. Перенести действие  "Извлечь данные из документа" на рабочую область.
    Image Modified
  2. Настроить параметры действия "Извлечь данные из документа".
    Image Modified
  3. Нажать на кнопку "Старт"  в верхней панели.

Результат

Программный : Программный робот отработал успешно. Поля  Поля с данными распознаны.
Image Modified


Точность распознавания
Номер СНИЛС1
Фамилия1
Имя1
Отчество1
Дата рождения1
Место рождения1
Пол1
Дата регистрации1

Изображение с наложенными блоками:
Image Modified