Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Extract data from a document Version 4 (Рython)

Группа действийAction group: Robin OCR 

Описание

Действие извлекает поля с данными из указанного файла, в зависимости от выбранного документа.  Действие работает с документами: СНИЛС, первый разворот и прописка паспорта.

Image Removed

Настройки

...

Примечание
The action is obsolete. It can be replaced by the action "Extract data from a document Dbrain OCR".

Description

The action retrieves the data of the data field from the selected document.

Action icon

Image Added

Parameters and their settings

РезультатыСловарь, содержащий значения, извлеченные из исходного изображения. Список полей для каждого типа документов указаны в документации по платформе.Путь к изображению с наложенными блоками.Точность распознавания каждого поля на изображении в диапазоне от 0 до 1.
PropertyDescriptionTypeFilling exampleMandatory field
Parameters
File pathThe path to the file to extract the data from. Supported formats

Свойство

Описание

Тип

Пример заполнения

Обязательность заполнения поля

Параметры

Путь к файлу

Путь к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png.Robin.FilePath
ДаYes
Document typeThe type of document to extract data from

Тип документа

Тип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полей.Robin.String

Да


Yes
Folder pathThe path to the folder where a copy of the source file with superimposed blocks will be saved, into which the recognition action divides it. To save it, you also need to fill in the «File name» field

Путь к папке

Путь к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле «Имя файла».Robin.FolderPathC:\doc\imgНетNo
File nameThe name of the copy of the source file with superimposed blocks (without extension). The image will be created with the *.png extension. To save it, you also need to fill in the «Folder path» field

Имя файла

Название изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле «Путь к папке».Robin.String
НетNo
ПерезаписатьOverwriteЕсли «true», и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если «false», файл перезаписан не будет, и действие вернет ошибку.If «true», and a file with the same name and extension exists in the specified folder, then a new file with blocks will overwrite it. If «false», the file will not be overwritten, and the action will return an errorRobin.BooleantrueНетNo
Results

Извлеченные данные

Extracted textThe data of each field in the document extracted from the original imageRobin.Dictionary

Изображение с блоками



Image with blocksThe path to the image file with superimposed blocksRobin.FilePath

Точность распознавания



Recognition confidenceThe accuracy of recognition of each field in the image is in the range from 0 to 1Robin.Dictionary

Особые условия использования

Для каждого вида документа есть набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым.  

Ключи возвращаются на русском. Сейчас нет возможности выбирать язык ключей словаря для действия.

Поля для паспорта:

  • "Паспорт выдан", ключ англ. - IssuedBy
  • "Дата выдачи", ключ англ. – IssuedDate
  • "Код подразделения", ключ англ. – IssuedCode
  • "Личная подпись", ключ англ. – Signature

  • "Фамилия", ключ англ. – LName,

  • "Имя", ключ англ. – FName,

  • "Отчество", ключ англ. – MName,

  • "Пол", ключ англ. – Sex,

  • "Фото", ключ англ. – Photo
  • "Дата рождения", ключ англ. – BirthDate

  • "Место рождения", ключ англ. – BirthPlace

  • Машиночитаемая запись на третьей странице, ключ англ. – MRZ,

  • Номер паспорта, ключ англ. – Number

Поля подпись, фото извлекать логическими. Все остальные строковые.

Для прописки:

  • Дата регистрации
  • Регион
  • Пункт
  • Район
  • Улица
  • Подразделение
  • Код подразделения

Для СНИЛС:

  • Number – Номер СНИЛС
  • LName '– Фамилия
  • FName – Имя
  • MName – Отчество
  • BirthDate – Дата рождения
  • BirthPlace – Место рождения
  • Sex – Пол
  • RegDate – Дата регистрации

Робот вернет ошибку, если:

  • заполнено поле "Путь к папке" и не заполнено "Имя файла".

  • заполнено поле "Имя файла" и не заполнено "Путь к файлу".

  • в поле "Путь к файлу" подается недопустимый формат входного файла.
  • по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.

Пример использования 

Задача: извлечь поля с данными из документа СНИЛС.

Image Removed

Решение: воспользоваться действием "Извлечь данные из документа". 

Реализация:

  1. Перенести действие "Извлечь данные из документа" на рабочую область. 
    Image Removed
  2. Заполнить параметры действия "Извлечь данные из документа". 
    Image Removed
  3. Нажать на кнопку "Старт" в верхней панели. 

Результат: 

Программный робот отработал успешно.

Image Removed



Special conditions of use

For each document view there is a set of fields that the robot will search for.If the image does not contain the fields it is looking for, the field value will be returned empty.  

The keys are returned in Russian. Now there is no possibility to select the language of dictionary keys for an action.

Passport fields:

  • IssuedBy
  • IssuedDate
  • IssuedCode
  • Signature

  • LName,

  • FName,

  • MName,

  • Sex,

  • Photo
  • BirthDate

  • BirthPlace

  • MRZ,

  • Number

Extract signature, photo fields as boolean fields. All other fields are string.

For residency:

  • Date of registration
  • Region
  • Point
  • District
  • Street
  • Unit
  • Unit code

For SNILS:

  • Number
  • LName
  • FName
  • MName
  • BirthDate
  • BirthPlace
  • Sex
  • RegDate


The robot will return an error if:

  • The "Folder path" field is filled in and the "File name" field is not filled in.

  • The "File name" field is filled in and the "File path" is not filled in.

  • An invalid input file format is entered in the "File path" field.

  • There is already a file with the specified name on the specified path and the "overwrite" field = false.

Example of use 

Task

Extract the data fields from the SNILS document.

Image Added

Solution

Use the "Extract data from a document" action. 

Implementation

  1. Move the "Extract data from a document" action to the workspace. 
    Image Added
  2. Set the parameters of the "Extract data from a document" action. 
    Image Added
  3. Click on the "Start" button in the top panel. 

Result

The program robot completed successfully.

Image Added

 

Data from the SNILS document has been extracted. The image is saved to the specified folder with overlaid blocksДанные из документа СНИЛС извлечены. Сохранено изображение в указанную папку с наложенными блоками