Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Извлечь данные из документа

...

Версия 3 (Python)

Группа действий: Распознавание текста

...

Описание

Действие извлекает данные из документов (Паспорт 2-3стр., Паспорт 5стр., СНИЛС) и сохраняет их в виде словаря, содержащего извлеченные данные документа, и изображение с блоками, из которых брались эти данные. Для извлечения данных действие использует сервисы Dbrain, поэтому для его работы потребуется API-ключ вендора.

Image Removed

...

поля с данными из указанного файла, в зависимости от выбранного типа документа.

Иконка действия

Image Added

Параметры и их настройки

..C:\doc\img.png к сервису . "true" "false"..

Выпадающий список из элементов:

Паспорт 2-3стр. "Имя файла".Folder "Путь к папке".. значение "true" "false"., где ключ - наименование поля, а значение - данные из соответствующих значению полей особых условиях использования действия.. Ключ .
СвойствоОписаниеТипПример заполненияОбязательность заполнения поля
Параметры
Путь к файлуПуть к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, pngRobin.FilePath
Да
API-ключУникальный идентификатор для доступа к сервису DbrainRobin.String
Да
Облачный серверЕсли значение «true», то действие будет отправлять запрос на облачный сервер DBrain. Если «false», действие отправит запрос на локальный сервер DbrainRobin.BooleantrueНет
Тип документаТип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полей
  • Паспорт 5стр.
  • СНИЛС
  • Robin.String
    Да
    Путь к папкеПуть к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле «Имя файла»Robin.FolderPathC:\doc\imgНет
    Имя файлаНазвание изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле «Путь к папке»Robin.String
    Нет
    Тайм-аут, мсВремя в миллисекундах, в течение которого будет происходить извлечение данных из документа. Значение по умолчанию 120000 мсRobin.Numeric
    Нет
    ПерезаписатьЕсли «true», и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если «false», файл перезаписан не будет, и действие вернет ошибкуRobin.BooleantrueНет
    Результаты
    Извлеченные данныеСловарь, содержащий значения, извлеченные из исходного изображения. Список полей для каждого типа документов указаны в документации по платформеRobin.Dictionary

    Изображение с блокамиПуть к изображению с наложенными блокамиRobin.FilePath

    Точность распознаванияТочность распознавания каждого поля на изображении в диапазоне от 0 до 1. Ключ - имя поля, значение - точность распознавания данного поляRobin.Dictionary

    Особые условия

    ...

    использования 

    Подключение к Dbrain https://doc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku

    Нейросеть распознает только российские документы.  Действие работает с конкретными видами документов:  Снилс, первый разворот и прописка паспорта.

    Для каждого вида документа есть определен набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым.  Ключи возвращаются на русском. 

    ...

    • Паспорт выдан
    • Дата выдачи
    • Код подразделения

    • Фамилия

    • Имя

    • Отчество

    • Пол

    • Дата рождения
    • Место рождения

    • Номер и серия паспорта

    ...

    Ключи для прописки (5 стр):

    ...

    • заполнено поле "Путь к папке" и не заполнено "Имя файла".

    • заполнено поле "Имя файла" и не заполнено "Путь к файлу".

    • в поле "Путь к файлу" подается недопустимый формат входного файла.
    • по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.
    • указан неверный API-ключ.
    • Тайм-аут закончился, результат не получен.
    • Облачный сервер не отмечен, локальный сервер не развернут пользователем на машине.

    Пример

    ...

    использования 

    Задача

    Распознать : распознать поля с данными документа из файла.

    Документ для распознания:
    Image Added

    Решение

    Воспользоваться Решение: воспользоваться действием "Извлечь данные из документа". 

    Реализация

    ...

    Документ для распознания:

    ...

    1. Перенести действие  "Извлечь данные из документа" на рабочую область.
      Image Modified
    2. Настроить параметры действия "Извлечь данные из документа".
      Image Modified
    3. Нажать на кнопку "Старт"  в верхней панели.

    Результат

    Программный : Программный робот отработал успешно. Поля  Поля с данными распознаны.
    Image Modified


    Точность распознавания
    Номер СНИЛС1
    Фамилия1
    Имя1
    Отчество1
    Дата рождения1
    Место рождения1
    Пол1
    Дата регистрации1

    Изображение с наложенными блоками:
    Image Modified