Извлечь данные из документа Версия 4 (Рython)
Группа действий: Robin OCR
Description
The action retrieves the data of the data field from the selected document.
Action icon
Parameters and their settings
Property | Description | Type | Filling example | Mandatory field |
Parameters | ||||
File path | The path to the file to extract the data from. Supported formats: jpg, jpeg, bmp, png | Robin.FilePath | Yes | |
Document type | The type of document to extract data from | Robin.String | Yes | |
Folder path | The path to the folder where a copy of the source file with superimposed blocks will be saved, into which the recognition action divides it. To save it, you also need to fill in the «File name» field | Robin.FolderPath | C:\doc\img | No |
File name | The name of the copy of the source file with superimposed blocks (without extension). The image will be created with the *.png extension. To save it, you also need to fill in the «Folder path» field | Robin.String | No | |
Overwrite | If «true», and a file with the same name and extension exists in the specified folder, then a new file with blocks will overwrite it. If «false», the file will not be overwritten, and the action will return an error | Robin.Boolean | true | No |
Results | ||||
Extracted text | The data of each field in the document extracted from the original image | Robin.Dictionary | ||
Image with blocks | The path to the image file with superimposed blocks | Robin.FilePath | ||
Recognition confidence | The accuracy of recognition of each field in the image is in the range from 0 to 1 | Robin.Dictionary |
Особые условия использования
Для каждого вида документа есть набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым.
Ключи возвращаются на русском. Сейчас нет возможности выбирать язык ключей словаря для действия.
Поля для паспорта:
- "Паспорт выдан", ключ англ. - IssuedBy
- "Дата выдачи", ключ англ. – IssuedDate
- "Код подразделения", ключ англ. – IssuedCode
"Личная подпись", ключ англ. – Signature
"Фамилия", ключ англ. – LName,
"Имя", ключ англ. – FName,
"Отчество", ключ англ. – MName,
"Пол", ключ англ. – Sex,
- "Фото", ключ англ. – Photo
"Дата рождения", ключ англ. – BirthDate
"Место рождения", ключ англ. – BirthPlace
Машиночитаемая запись на третьей странице, ключ англ. – MRZ,
- Номер паспорта, ключ англ. – Number
Поля подпись, фото извлекать логическими. Все остальные строковые.
Для прописки:
- Дата регистрации
- Регион
- Пункт
- Район
- Улица
- Подразделение
- Код подразделения
Для СНИЛС:
- Number – Номер СНИЛС
- LName '– Фамилия
- FName – Имя
- MName – Отчество
- BirthDate – Дата рождения
- BirthPlace – Место рождения
- Sex – Пол
- RegDate – Дата регистрации
Робот вернет ошибку, если:
заполнено поле "Путь к папке" и не заполнено "Имя файла".
заполнено поле "Имя файла" и не заполнено "Путь к файлу".
- в поле "Путь к файлу" подается недопустимый формат входного файла.
- по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.
Пример использования
Задача: извлечь поля с данными из документа СНИЛС.
Решение: воспользоваться действием "Извлечь данные из документа".
Реализация:
- Перенести действие "Извлечь данные из документа" на рабочую область.
- Заполнить параметры действия "Извлечь данные из документа".
- Нажать на кнопку "Старт" в верхней панели.
Результат:
Программный робот отработал успешно.
Данные из документа СНИЛС извлечены. Сохранено изображение в указанную папку с наложенными блоками.