Извлечь таблицу Версия 3 (Python)
Группа действий: PDF
Описание
Действие возвращает таблицу с указанной страницы PDF-документа
Иконка действия
Параметры и их настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Путь к файлу | Путь к PDF-файлу, из которого необходимо извлечь таблицу | Robin.FilePath | Да | |
Начальная страница | Страница в документе, с которой начинается таблица. Нумерация начинается с 1. Значение по умолчанию 1 | Robin.Numeric | Нет | |
Конечная страница | Страница в документе, на которой заканчивается таблица | Robin.Numeric | Нет | |
Номер таблицы | Порядковый номер таблицы в документе на указанной странице. Нумерация начинается с 1. Значение по умолчанию 1. Параметр "Номер таблицы" учитывается лишь в рамках одной страницы, но если указан диапазон страниц, то действие берет последнюю таблицу с указанной начальной страницы (если не указано , то с 1), и скрепляет с последующими таблицами идущими на следующих страницах | Robin.Numeric | Нет | |
С заголовком | Если значение "true", первая строка таблицы будет выделена отдельно как заголовок и не будет входить в строки с содержимым таблицы | Robin.Boolean | true | Нет |
Убрать дубли заголовка | Если значение "true", в заголовке полученной таблицы к одинаковым названиям столбцов будут добавлены индексы. Нумерация начинается с 1 | Robin.Boolean | true | Нет |
Результаты | ||||
Таблица | Таблица, сформированная на основе данных, извлеченных из исходного документа | Robin.DataTable |
Особые условия использования
Действие работает только с текстовым слоем.
Пример использования
Задача
В документе-PDF имеется 2 таблицы на второй странице. Необходимо извлечь вторую таблицу и сохранить эту таблицу в CSV.
Решение
Воспользоваться действиями "Извлечь таблицу", "Сохранить таблицу в CSV".
Реализация
- Собрать схему робота, состоящую из действий.
- Настроить параметры для действия "Извлечь таблицу".
- Настроить параметры действия "Сохранить таблицу в CSV".
- Нажать на кнопку "Старт" в верхней панели.
Результат
Программный робот отработал успешно.
Таблица извлечена из документа-PDF и сохранена в формат CSV.