Извлечь таблицу Версия 3 (Python)

Группа действий: PDF


Описание

Действие возвращает таблицу с указанной страницы PDF-документа

Иконка действия


Параметры и их настройки

Свойство

Описание

Тип

Пример заполнения

Обязательность заполнения поля

Параметры

Путь к файлу

Путь к PDF-файлу, из которого необходимо извлечь таблицу

Robin.FilePath


Да

Начальная страница

Страница в документе, с которой начинается таблица. Нумерация начинается с 1. Значение по умолчанию 1

Robin.Numeric


Нет

Конечная страница

Страница в документе, на которой заканчивается таблица

Robin.Numeric


Нет

Номер таблицы

Порядковый номер таблицы в документе на указанной странице. Нумерация начинается с 1. Значение по умолчанию 1. Параметр "Номер таблицы" учитывается лишь в рамках одной страницы, но если указан диапазон страниц, то действие берет последнюю таблицу с указанной начальной страницы (если не указано , то с 1), и скрепляет с последующими таблицами идущими на следующих страницах

Robin.Numeric


Нет

С заголовком

Если значение "true", первая строка таблицы будет выделена отдельно как заголовок и не будет входить в строки с содержимым таблицы

Robin.Boolean

true

Нет

Убрать дубли заголовка

Если значение "true", в заголовке полученной таблицы к одинаковым названиям столбцов будут добавлены индексы. Нумерация начинается с 1

Robin.Boolean

true

Нет

Результаты

Таблица

Таблица, сформированная на основе данных, извлеченных из исходного документа

Robin.DataTable



Особые условия использования

Действие работает только с текстовым слоем.  

Пример использования 

Задача

В документе-PDF имеется 2 таблицы на второй странице. Необходимо извлечь вторую таблицу и сохранить эту таблицу в CSV.

Решение

Воспользоваться действиями "Извлечь таблицу", "Сохранить таблицу в CSV". 

Реализация

  1. Собрать схему робота, состоящую из действий.

  2. Настроить параметры для действия "Извлечь таблицу". 

  3. Настроить параметры действия "Сохранить таблицу в CSV". 

  4. Нажать на кнопку "Старт" в верхней панели. 

Результат

Программный робот отработал успешно.

Таблица извлечена из документа-PDF и сохранена в формат CSV.


 

  • Нет меток