История страницы
Найти документы в файле
...
Версия 4 (Python)
Группа действий: Распознавание текста
...
Описание
Действие ищет в исходном файле различные типы документов и сохраняет их в виде отдельных файлов. При необходимости ориентация документов будет исправлена.
Иконка действия
...
Параметры и их настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Путь к файлу | Путь к файлу, из которого нужно получить отдельные документы. Поддерживаемые форматы: jpg, jpeg, bmp, png, pdf |
Robin.FilePath | C:\doc\img.png | Да | |
API ключ | Уникальный идентификатор для доступа к сервису Dbrain |
Robin.String | Да | ||
Путь к папке | Путь к папке, в которую будут сохранены изображения найденных документов. Изображения будут созданы с расширением *.png, а их имена будут содержать название типа соответствующего документа. Если поле не заполнено, то изображения сохранятся в папку исходного файла |
Robin.FolderPath | C:\doc\Folder | Нет | |
Перезаписать | Если "true", и в указанной папке существует изображение с таким же именем и расширением, то новое изображение его перезапишет. Если "false", то изображение перезаписано не будет и действие вернет ошибку |
Robin.Boolean | true | Нет | |
Добавить исходное название | Если "true", то имя каждого изображения будет содержать имя исходного файла и название типа документа, указанного на изображении. Если "false", то имена изображений будут содержать только названия типов документов |
Robin.Boolean | true | Нет | |
Тайм-аут, мс | Время в миллисекундах, в течение которого будет происходить поиск документов в файле. Значение по умолчанию 120000 мс |
Robin.Numeric | Нет | |||
Результаты | ||||
Результат | Коллекция путей к изображениям документов, которые были найдены в исходном файле. Если найдено несколько документов одного типа, к названиям их изображений будет добавлен индекс |
Robin.Collection |
Особые условия
...
использования
Подключение к Dbrain https://docsdoc.dbrain.io/podklyuchenie/podklyuchenie-k-oblaku
Действие работает с конкретными видами документов: СНИЛС, первый разворот и прописка паспорта.
Пример использования
Задача: распознать текст из файла.
Нейросеть распознает только российские документы.
Если пользователь подает на вход документы, кроме заявленных (СНИЛС, первый разворот и прописка паспорта), то при проценте сходства <50, они не будут классифицированы и записаны в результирующую таблицу.
Пример работы параметра "Добавить исходное название": Если true, то результирующий файл будет записан как "Тесты действий_СНИЛС_1.png". Если false, то "СНИЛС_1.png".
Робот вернет ошибку, если:
- в поле "Путь к файлу" подается недопустимый формат входного файла.
- по указанному пути уже есть файл с указанным именем и поле "перезаписать" = false.
- Тайм-аут закончился, результат не получен.
- указан неверный API-ключ.
Пример использования
Задача
Найти документы в файле.
Решение
Воспользоваться действием "Найти документы в файлеРешение: воспользоваться действием "Извлечение текста из файла".
Реализация
...
- Перенести действие "Извлечение текста из файлаНайти документы в файле" на рабочую область.
- Настроить параметры действия "Найти документы в файле".
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно. Документы сохранены в отдельные файлы.