Найти печати и подписи Версия 1 (Python)
Группа действий: Robin OCR, подгруппа Robin
Описание
Действие ищет на изображении объекты трех типов: круглые печати, прямоугольные печати и подписи. Затем записывает информацию только о выбранных типах объектов в таблицу
Иконка действия
Параметры
Входные параметры
Путь к файлу Путь к файлу, в котором нужно найти печати и подписи. Поддерживаемые форматы: jpg, jpeg, bmp, png, pdf
Номер страницы Номер страницы файла, с которой нужно извлечь данные. Нумерация начинается с 1. Если поле не заполнено,
данные будут извлечены со всех страниц файла
Искать круглую печать Если "true", то действие будет искать круглые печати. Если "false", то все круглые печати будут пропущены
Искать прямоугольную печать Если "true", то действие будет искать прямоугольные печати. Если "false", то все прямоугольные печати будут пропущены
Искать подпись Если "true", то действие будет искать подписи или расшифровки. Если "false", то все подписи будут пропущены
Минимальная точность распознавания Точность распознавания, достаточная для сохранения результатов поиска в таблицу. Допустимое значение - любое число от 0 до 1
Значение по умолчанию: 0,2
Путь к папке Путь к папке, в которую будут сохранены изображения страниц файла с выделенными на них печатями и подписями.
Для сохранения файла также нужно заполнить поле "Имя файла"
Имя файла Название для изображений с выделенными печатями и подписями (без расширения).
Если исходный файл - многостраничный, к названию сохраненных файлов будет добавлен соответствующий номер страницы.
По умолчанию создаются изображения с расширением .png. Для сохранения изображений также нужно заполнить поле "Путь к папке"
Перезаписать Если "true", и в указанной папке существует изображение с таким же именем и расширением, то новое изображение его перезапишет
Если "false", то изображение не будет перезаписано и действие вернет ошибку
Выходные параметры
Изображения с блоками Коллекция путей к изображениям с выделенными печатями и подписями
Таблица Таблица, в которой собрана полная информация о найденных объектах
Настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Путь к файлу | Путь к файлу, в котором нужно найти печати и подписи. Поддерживаемые форматы: jpg, jpeg, bmp, png, pdf | Robin.Image | test.pdf | Да |
Номер страницы | Номер страницы файла, с которой нужно извлечь данные. Нумерация начинается с 1. Если поле не заполнено, данные будут извлечены со всех страниц файла | Robin.Numeric | 4 | Нет |
Искать круглую печать | Если "true", то действие будет искать круглые печати. Если "false", то все круглые печати будут пропущены | Robin.Boolean | True | Нет |
Искать прямоугольную печать | Если "true", то действие будет искать прямоугольные печати. Если "false", то все прямоугольные печати будут пропущены | Robin.Boolean | True | Нет |
Искать подпись | Если "true", то действие будет искать подписи или расшифровки. Если "false", то все подписи будут пропущены | Robin.Boolean | True | Нет |
Минимальная точность распознавания | Точность распознавания, достаточная для сохранения результатов поиска в таблицу. Допустимое значение - любое число от 0 до 1. Значение по умолчанию: 0,2 | Robin.Numeric | 0,5 | Нет |
Путь к папке | Путь к папке, в которую будут сохранены изображения страниц файла с выделенными на них печатями и подписями. Для сохранения файла также нужно заполнить поле "Имя файла" | Robin.FolderPath | C:\Users\user\Downloads | Нет |
Имя файла | Название для изображений с выделенными печатями и подписями (без расширения). Если исходный файл - многостраничный, к названию сохраненных файлов будет добавлен соответствующий номер страницы. По умолчанию создаются изображения с расширением .png. Для сохранения изображений также нужно заполнить поле "Путь к папке" | Robin.String | Тест | Нет |
Перезаписать | Если "true", и в указанной папке существует изображение с таким же именем и расширением, то новое изображение его перезапишет. Если "false", то изображение не будет перезаписано и действие вернет ошибку | Robin.Boolean | True | Нет |
Результаты | ||||
---|---|---|---|---|
Изображения с блоками | Коллекция путей к изображениям с выделенными печатями и подписями | Robin.Collection | ||
Таблица | Таблица, в которой собрана полная информация о найденных объектах | Robin.DataTable |
Особые условия использования
- Действие работает с многостраничными файлами в PDF. Можно обработать все страницы документа, если не указывать номер страницы.
- Рекомендуется использовать действие с документами ТОРГ-12, ТРН, ТТН, УПД.
- Если в файле есть искомый объект (печати и подписи), но параметр его поиска = false, то в результате данные о нем отображаться не будут.
- Если действие не найдет или не распознает печати и подписи, то робот завершится без ошибки, но вернет пустые результаты.
Если "Минимальная точность распознавания" = 0, то все найденные объекты будут записаны в результат. Если "Минимальная точность распознавания" 1, то только 100% распознанные объекты будут записаны в результат.
Если на странице найдено несколько объектов, удовлетворяющих условиям поиска, то будет создано только одно изображение этой страницы с выделенными на ней объектами. Если выбрали поиск по всем страницам, а печати были найдены только на нескольких, то будут сохранены все страницы исходного документа, при корректно настроенных параметрах для сохранения: "Путь к папке" и "Имя файла".
- Если указан неверный номер страницы файла, то робот завершится с ошибкой.
- Если заполнено поле "Путь к папке" и не заполнено "Имя файла", то робот завершится с ошибкой.
- Если заполнено поле "Имя файла" и не заполнено "Путь к папке", то робот завершится с ошибкой.
- Если в параметре "Путь к папке" указана папка, где уже есть файл с указанным именем и параметр "Перезаписать" = false, то робот завершится с ошибкой.
- Если параметры "Путь к папке", "Имя файла" не заполнены, то файл с наложенными блоками не сохранится, ошибки не будет.
- Если параметры "Имя файла" и "Путь к файлу" заполнены, то изображение с блоками сохраняется в указанной папке с указанным именем в формате .png.
- Если сохраняется многостраничный файл, то к названию каждого изображения с блоками будет автоматически добавлен номер страницы.
Результирующая таблица состоит из следующих столбцов:
- "Объект" - по названию можно будет точно соотнести объект на странице изображения с блоками с информацией, записанной о нем в таблице.
- "Тип объекта" – возможные значения: "Круглая печать", "Прямоугольная печать", "Подпись".
- "Координаты верхнего левого угла". Пример: (53; 87) Тип данных: Robin.LocationPoint.
- "Координаты нижнего правого угла". Пример: (53; 87) Тип данных: Robin.LocationPoint.
- "Номер страницы" - номер страницы, на которой найден объект.
- "Индекс" - порядковый номер объекта искомого вида на текущей странице.
- "Точность распознавания" – точность распознавания объекта в диапазоне от 0 до 1.
Пример использования
Задача: нужно найти печати и подписи в файле.
Решение: использовать действие "Найти печати и подписи".
Реализация:
- Собрать робота, состоящего из действий "Найти печати и подписи", "Сохранить таблицу в CSV" - добавить, если нужно посмотреть таблицу с полученными данными:
- Заполнить параметры действия "Найти печати и подписи".
- Заполнить параметры действия "Сохранить таблицу в CSV".
- Нажать на кнопку "Старт" в верхней панели.
Результат:
Программный робот отработал успешно.
Изображение с блоками:
Таблица: