Найти документы в файле Версия 4 (Python)
Группа действий: Распознавание текста
Описание
Действие ищет в исходном файле различные типы документов и сохраняет их в виде отдельных файлов. При необходимости ориентация документов будет исправлена.
Иконка действия
Параметры и их настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Путь к файлу | Путь к файлу, из которого нужно получить отдельные документы. Поддерживаемые форматы: jpg, jpeg, bmp, png, pdf | Robin.FilePath | C:\doc\img.png | Да |
API ключ | Уникальный идентификатор для доступа к сервису Dbrain | Robin.String | Да | |
Путь к папке | Путь к папке, в которую будут сохранены изображения найденных документов. Изображения будут созданы с расширением *.png, а их имена будут содержать название типа соответствующего документа. Если поле не заполнено, то изображения сохранятся в папку исходного файла | Robin.FolderPath | C:\doc\Folder | Нет |
Перезаписать | Если "true", и в указанной папке существует изображение с таким же именем и расширением, то новое изображение его перезапишет. Если "false", то изображение перезаписано не будет и действие вернет ошибку | Robin.Boolean | true | Нет |
Добавить исходное название | Если "true", то имя каждого изображения будет содержать имя исходного файла и название типа документа, указанного на изображении. Если "false", то имена изображений будут содержать только названия типов документов | Robin.Boolean | true | Нет |
Тайм-аут, мс | Время в миллисекундах, в течение которого будет происходить поиск документов в файле. Значение по умолчанию 120000 мс | Robin.Numeric | Нет | |
Результаты | ||||
Результат | Коллекция путей к изображениям документов, которые были найдены в исходном файле. Если найдено несколько документов одного типа, к названиям их изображений будет добавлен индекс | Robin.Collection |
Особые условия использования
Подключение к Dbrain https://doc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku
Действие работает с конкретными видами документов: СНИЛС, первый разворот и прописка паспорта.
Нейросеть распознает только российские документы.
Если пользователь подает на вход документы, кроме заявленных (СНИЛС, первый разворот и прописка паспорта), то при проценте сходства <50, они не будут классифицированы и записаны в результирующую таблицу.
Пример работы параметра "Добавить исходное название": Если true, то результирующий файл будет записан как "Тесты действий_СНИЛС_1.png". Если false, то "СНИЛС_1.png".
Робот вернет ошибку, если:
- в поле "Путь к файлу" подается недопустимый формат входного файла.
- по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.
- Тайм-аут закончился, результат не получен.
- указан неверный API-ключ.
Пример использования
Задача
Найти документы в файле.
Решение
Воспользоваться действием "Найти документы в файле".
Реализация
- Перенести действие "Найти документы в файле" на рабочую область.
- Настроить параметры действия "Найти документы в файле".
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно. Документы сохранены в отдельные файлы.