Извлечь данные из документа Версия 4 (Рython)

Группа действий: Robin OCR 


Действие устарело. Его можно заменить на действие "Извлечь данные из документа".

Описание

Действие извлекает поля с данными из указанного файла, в зависимости от выбранного документа.  Действие работает с документами: СНИЛС, первый разворот и прописка паспорта.

Иконка действия


Параметры и их настройка

Свойство

Описание

Тип

Пример заполнения

Обязательность заполнения поля

Параметры

Путь к файлу

Путь к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png

Robin.FilePath


Да

Тип документа

Тип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полей

Robin.String


Да

Путь к папке

Путь к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле "Имя файла"

Robin.FolderPath

C:\doc\img

Нет

Имя файла

Название изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле "Путь к папке"

Robin.String


Нет

Перезаписать

Если "true", и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если "false", файл перезаписан не будет, и действие вернет ошибку

Robin.Boolean

true

Нет

Результаты

Извлеченные данные

Словарь, содержащий значения, извлеченные из исходного изображения. Список полей для каждого типа документов указаны в документации по платформе

Robin.Dictionary



Изображение с блоками

Путь к изображению с наложенными блоками

Robin.FilePath



Точность распознавания

Точность распознавания каждого поля на изображении в диапазоне от 0 до 1

Robin.Dictionary



Особые условия использования

Для каждого вида документа есть набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым.  

Ключи возвращаются на русском. Сейчас нет возможности выбирать язык ключей словаря для действия.

Поля для паспорта:

  • "Паспорт выдан", ключ англ. - IssuedBy
  • "Дата выдачи", ключ англ. – IssuedDate
  • "Код подразделения", ключ англ. – IssuedCode
  • "Личная подпись", ключ англ. – Signature

  • "Фамилия", ключ англ. – LName,

  • "Имя", ключ англ. – FName,

  • "Отчество", ключ англ. – MName,

  • "Пол", ключ англ. – Sex,

  • "Фото", ключ англ. – Photo
  • "Дата рождения", ключ англ. – BirthDate

  • "Место рождения", ключ англ. – BirthPlace

  • Машиночитаемая запись на третьей странице, ключ англ. – MRZ,

  • Номер паспорта, ключ англ. – Number

Поля подпись, фото извлекать логическими. Все остальные строковые.

Для прописки:

  • Дата регистрации
  • Регион
  • Пункт
  • Район
  • Улица
  • Подразделение
  • Код подразделения

Для СНИЛС:

  • Number – Номер СНИЛС
  • LName '– Фамилия
  • FName – Имя
  • MName – Отчество
  • BirthDate – Дата рождения
  • BirthPlace – Место рождения
  • Sex – Пол
  • RegDate – Дата регистрации


Робот вернет ошибку, если:

  • заполнено поле "Путь к папке" и не заполнено "Имя файла".

  • заполнено поле "Имя файла" и не заполнено "Путь к файлу".

  • в поле "Путь к файлу" подается недопустимый формат входного файла.
  • по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.

Пример использования 

Задача

Извлечь поля с данными из документа СНИЛС.

Решение

Воспользоваться действием "Извлечь данные из документа". 

Реализация

  1. Перенести действие "Извлечь данные из документа" на рабочую область. 
  2. Заполнить параметры действия "Извлечь данные из документа". 

  3. Нажать на кнопку "Старт" в верхней панели. 

Результат

Программный робот отработал успешно.

Данные из документа СНИЛС извлечены. Сохранено изображение в указанную папку с наложенными блоками.

  • Нет меток