История страницы
Извлечь данные из документа
...
Версия 3 (Python)
Группа действий: Распознавание текста
...
Описание
Действие извлекает поля с данными из указанного файла, в зависимости от выбранного от выбранного типа документа.
Иконка действия
...
Параметры и их настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Путь к файлу | Путь к изображению, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png |
Robin.FilePath |
C:\doc\img.png
Да | |
API-ключ | Уникальный идентификатор для доступа |
к сервису Dbrain |
Robin.String | Да | ||
Облачный сервер | Если значение |
«true», то действие будет отправлять запрос на облачный сервер DBrain. Если |
«false», действие отправит запрос на локальный сервер Dbrain |
Robin.Boolean | true | Нет | |
Тип документа |
Выпадающий список из элементов: заменить первое совпадение, заменить все совпадения.
Режим замены текста.
Тип документа в исходном изображении. В зависимости от выбранного типа будут извлечены соответствующие наборы полей |
Robin.String | Да | ||
Путь к папке | Путь к папке, в которую будет сохранена копия исходного изображения с наложенными блоками, на которые его делит действие для распознавания. Для сохранения также нужно заполнить поле |
«Имя файла» | Robin.FolderPath | C:\doc\ |
img | Нет |
Имя файла | Название изображения с наложенными блоками (без расширения). Изображение будет создано с расширением *.png. Для сохранения также нужно заполнить поле |
«Путь к папке» | Robin.String | Нет | |
Тайм-аут, мс | Время в миллисекундах, в течение которого будет происходить извлечение данных из документа. Значение по умолчанию 120000 мс |
Robin.Numeric | Нет | ||
Перезаписать | Если |
«true», и в указанной папке существует изображение с таким же именем и расширением, то новое изображение с блоками его перезапишет. Если |
«false», файл перезаписан не будет, и действие вернет ошибку |
Robin.Boolean | true | Нет | ||
Результаты | ||||
Извлеченные данные | Словарь, содержащий значения, извлеченные из исходного изображения. Список полей для каждого типа документов указаны в документации по платформе |
Robin.Dictionary | |||
Изображение с блоками | Путь к изображению с наложенными блоками |
Robin.FilePath | |||
Точность распознавания | Точность распознавания каждого поля на изображении в диапазоне от 0 до 1. |
Ключ - имя поля, значение - точность распознавания данного поля |
Robin.Dictionary |
Особые условия
...
использования
Подключение к Dbrain https://docsdoc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku
Нейросеть распознает только российские документы.
Для каждого вида документа определен набор полей, которые робот будет искать. Если изображение не содержит искомых полей, то значение поля вернется пустым.
Действие работает с конкретными видами документов: Снилс, первый разворот и прописка паспорта.
Пример использования
Задача: распознать текст из файла.
Решение: воспользоваться действием "Извлечение текста из файла".
Ключи возвращаются на русском.
Ключи для паспорта 2-3 стр.:
- Паспорт выдан
- Дата выдачи
Код подразделения
Фамилия
Имя
Отчество
Пол
- Дата рождения
Место рождения
- Номер и серия паспорта
Ключи для прописки (5 стр):
- Полный адрес
- Дата регистрации
- Регион
- Район
- Пункт
- Р-н
- Улица
- Дом
- Строение
- Квартира
- Подразделение
- Код подразделения
Ключи для СНИЛС:
- Номер СНИЛС
- Фамилия
- Имя
- Отчество
- Дата рождения
- Место рождения
- Пол
- Дата регистрации
Робот вернет ошибку, если:
заполнено поле "Путь к папке" и не заполнено "Имя файла".
заполнено поле "Имя файла" и не заполнено "Путь к файлу".
- в поле "Путь к файлу" подается недопустимый формат входного файла.
- по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.
- указан неверный API-ключ.
- Тайм-аут закончился, результат не получен.
Облачный сервер не отмечен, локальный сервер не развернут пользователем на машине.
Пример использования
Задача
Распознать поля с данными документа из файла.
Документ для распознания:
Решение
Воспользоваться действием "Извлечь данные из документа".
Реализация
- Перенести действие "Извлечь данные из документа" на рабочую область.
- Настроить параметры действия "Извлечь данные из документа".
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно. Поля с данными распознаны.
Точность распознавания | |
---|---|
Номер СНИЛС | 1 |
Фамилия | 1 |
Имя | 1 |
Отчество | 1 |
Дата рождения | 1 |
Место рождения | 1 |
Пол | 1 |
Дата регистрации | 1 |
Изображение с наложенными блоками:
Реализация: