Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Извлечь данные из документа

...

Версия 3 (Python)

Группа действий: Распознавание текста

...

Описание

Действие извлекает поля с данными из указанного файла, в зависимости от выбранного от выбранного типа документа.

Иконка действия

Image Modified

...

Параметры и их настройки

СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлуПуть к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png
.
Robin.FilePath
.C:\doc\img.png

Да
API-ключУникальный идентификатор для доступа
к сервису
к сервису Dbrain
.
Robin.String
Да
Облачный серверЕсли значение
"true"
«true», то действие будет отправлять запрос на облачный сервер DBrain. Если
"false"
«false», действие отправит запрос на локальный сервер Dbrain
.
Robin.BooleantrueНет
Тип документаТип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полей
.

Выпадающий список из элементов:

  • Паспорт 2-3стр.
  • Паспорт 5стр.
  • СНИЛС
  • Robin.String
    Да
    Путь к папкеПуть к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле
    "Имя файла".
    «Имя файла»Robin.FolderPathC:\doc\
    Folder
    imgНет
    Имя файлаНазвание изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле
    "Путь к папке".
    «Путь к папке»Robin.String
    Нет
    Тайм-аут, мсВремя в миллисекундах, в течение которого будет происходить извлечение данных из документа. Значение по умолчанию 120000 мс
    .
    Robin.Numeric
    Нет
    ПерезаписатьЕсли
    значение "true"
    «true», и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если
    "false"
    «false», файл перезаписан не будет, и действие вернет ошибку
    .
    Robin.BooleantrueНет
    Результаты
    Извлеченные данныеСловарь, содержащий значения, извлеченные из исходного изображения. Список полей для каждого типа документов указаны в документации по платформе
    .
    Robin.Dictionary

    Изображение с блокамиПуть к изображению с наложенными блоками
    .
    Robin.FilePath

    Точность распознаванияТочность распознавания каждого поля на изображении в диапазоне от 0 до 1.
    Ключ
    Ключ - имя поля, значение - точность распознавания данного поля
    .
    Robin.Dictionary

    Особые условия

    ...

    использования 

    Подключение к Dbrain https://docsdoc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku

    Нейросеть распознает только российские документы.  

    Действие работает с конкретными видами документов:  Снилс, первый разворот и прописка паспорта.

    Для каждого вида документа есть определен набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым.  Ключи возвращаются на русском. 

    Поля Ключи для паспорта 2-3 стр.:

    • Паспорт выдан
    • Дата выдачи
    • Код подразделения

    • Фамилия

    • Имя

    • Отчество

    • Пол

    • Дата рождения
    • Место рождения

    • Номер и серия паспорта

    ...

    Ключи для прописки (5 стр):

    ...

    • Номер СНИЛС
    • Фамилия
    • Имя
    • Отчество
    • Дата рождения
    • Место рождения
    • Пол
    • Дата регистрации

    Робот вернет ошибку, если:

    • заполнено поле "Путь к папке" и не заполнено "Имя файла".

    • заполнено поле "Имя файла" и не заполнено "Путь к файлу".

    • в поле "Путь к файлу" подается недопустимый формат входного файла.
    • по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.
    • указан неверный API-ключ.
    • Тайм-аут закончился, результат не получен.

    Пример использования 

    • Облачный сервер не отмечен, локальный сервер не развернут пользователем на машине.

    Пример использования 

    Задача

    Распознать Задача: распознать поля с данными документа из файла.

    Документ для распознания:
    Image Added

    Решение

    Воспользоваться : воспользоваться действием "Извлечь данные из документа". 

    Реализация

    ...

    1. Перенести действие  "Извлечь данные из документа" на рабочую область.
      Image Modified
    2. Настроить параметры действия "Извлечь данные из документа".
      Image RemovedImage Added
    3. Нажать на кнопку "Старт"  в верхней панели.

    Результат

    Программный : Программный робот отработал успешно. Поля  Поля с данными распознаны.
    Image Added


    Точность распознавания
    Номер СНИЛС1
    Фамилия1
    Имя1
    Отчество1
    Дата рождения1
    Место рождения1
    Пол1
    Дата регистрации1

    Изображение с наложенными блоками:
    Image AddedImage Removed