Найти печати и подписи Версия 1 (Python)
Группа действий: Robin OCR, подгруппа Robin
Описание
Действие ищет на изображении объекты трех типов: круглые печати, прямоугольные печати и подписи. Затем записывает информацию только о выбранных типах объектов в таблицу.
Иконка действия
Параметры и их настройка
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Путь к файлу | Путь к файлу, в котором нужно найти печати и подписи. Поддерживаемые форматы: jpg, jpeg, bmp, png, pdf | Robin.Image | test.pdf | Да |
Номер страницы | Номер страницы файла, с которой нужно извлечь данные. Нумерация начинается с 1. Если поле не заполнено, данные будут извлечены со всех страниц файла | Robin.Numeric | 4 | Нет |
Искать круглую печать | Если "true", то действие будет искать круглые печати. Если "false", то все круглые печати будут пропущены | Robin.Boolean | True | Нет |
Искать прямоугольную печать | Если "true", то действие будет искать прямоугольные печати. Если "false", то все прямоугольные печати будут пропущены | Robin.Boolean | True | Нет |
Искать подпись | Если "true", то действие будет искать подписи или расшифровки. Если "false", то все подписи будут пропущены | Robin.Boolean | True | Нет |
Минимальная точность распознавания | Точность распознавания, достаточная для сохранения результатов поиска в таблицу. Допустимое значение - любое число от 0 до 1. Значение по умолчанию: 0,2 | Robin.Numeric | 0,5 | Нет |
Путь к папке | Путь к папке, в которую будут сохранены изображения страниц файла с выделенными на них печатями и подписями. Для сохранения файла также нужно заполнить поле "Имя файла" | Robin.FolderPath | C:\Users\user\Downloads | Нет |
Имя файла | Название для изображений с выделенными печатями и подписями (без расширения). Если исходный файл - многостраничный, к названию сохраненных файлов будет добавлен соответствующий номер страницы. По умолчанию создаются изображения с расширением .png. Для сохранения изображений также нужно заполнить поле "Путь к папке" | Robin.String | Тест | Нет |
Перезаписать | Если "true", и в указанной папке существует изображение с таким же именем и расширением, то новое изображение его перезапишет. Если "false", то изображение не будет перезаписано и действие вернет ошибку | Robin.Boolean | True | Нет |
Результаты | ||||
---|---|---|---|---|
Изображения с блоками | Коллекция путей к изображениям с выделенными печатями и подписями | Robin.Collection | ||
Таблица | Таблица, в которой собрана полная информация о найденных объектах | Robin.DataTable |
Особые условия использования
Действие работает с многостраничными файлами в PDF. Можно обработать все страницы документа, если не указывать номер страницы.
Рекомендуется использовать действие с документами ТОРГ-12, ТРН, ТТН, УПД.
Если в файле есть искомый объект (печати и подписи), но параметр его поиска = false, то в результате данные о нем отображаться не будут.
Если действие не найдет или не распознает печати и подписи, то робот завершится без ошибки, но вернет пустые результаты.
Если "Минимальная точность распознавания" = 0, то все найденные объекты будут записаны в результат. Если "Минимальная точность распознавания" =1, то все 100% распознанных объектов будут записаны в результат.
Если на странице найдено несколько объектов, удовлетворяющих условиям поиска, то будет создано только одно изображение этой страницы с выделенными на ней объектами.
Если выбрали поиск по всем страницам, а печати были найдены только на нескольких, то будут сохранены все страницы исходного документа, при корректно настроенных параметрах для сохранения: "Путь к папке" и "Имя файла".
Если параметры "Имя файла" и "Путь к файлу" заполнены, то изображение с блоками сохраняется в указанной папке с указанным именем в формате .png.
Если сохраняется многостраничный файл, то к названию каждого изображения с блоками будет автоматически добавлен номер страницы.
Результирующая таблица состоит из следующих столбцов:
- "Объект" - по названию можно будет точно соотнести объект на странице изображения с блоками с информацией, записанной о нем в таблице
- "Тип объекта" – возможные значения: "Круглая печать", "Прямоугольная печать", "Подпись"
- "Координаты верхнего левого угла". Пример: (53; 87) Тип данных: Robin.LocationPoint
- "Координаты нижнего правого угла". Пример: (53; 87) Тип данных: Robin.LocationPoint
- "Номер страницы" - номер страницы, на которой найден объект
- "Индекс" - порядковый номер объекта искомого вида на текущей странице
- "Точность распознавания" – точность распознавания объекта в диапазоне от 0 до 1
Пример использования
Задача
Нужно найти печати и подписи в файле.
Решение
Использовать действие "Найти печати и подписи".
Реализация
- Собрать робота, состоящего из действий "Найти печати и подписи", "Сохранить таблицу в CSV" - добавить, если нужно посмотреть таблицу с полученными данными:
- Заполнить параметры действия "Найти печати и подписи".
- Заполнить параметры действия "Сохранить таблицу в CSV".
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно.
Изображение с блоками.
Таблица.