Извлечь таблицу Версия 2 (Python)

Группа действий: PDF


Описание

Действие возвращает таблицу с указанной страницы PDF-документа.


Настройки

Свойство

Описание

Тип

Пример заполнения

Обязательность заполнения поля

Параметры

Путь к файлу

Путь к PDF-файлу, из которого необходимо извлечь таблицу.

Robin.FilePath


Да

Начальная страница

Страница в документе, с которой начинается таблица. Нумерация начинается с 1. Значение по умолчанию 1.

Robin.Numeric


Нет

Конечная страница

Страница в документе, на которой заканчивается таблица

Robin.Numeric


Нет

Номер таблицы

Порядковый номер таблицы в документе на указанной странице. Нумерация начинается с 1. Значение по умолчанию 1.

Robin.Numeric


Нет

С заголовком

Если значение «true», первая строка таблицы будет выделена отдельно как заголовок и не будет входить в строки с содержимым таблицы.

Robin.Boolean

true

Нет

Убрать дубли заголовка

Если значение «true», в заголовке полученной таблицы к одинаковым названиям столбцов будут добавлены индексы. Нумерация начинается с 1.

Robin.Boolean

true

Нет

Результаты

Таблица

Таблица, сформированная на основе данных, извлеченных из исходного документа.

Robin.DataTable



Особые условия использования

Действие работает только с текстовым слоем.  

Пример использования 

Задача: в документе-PDF имеется 2 таблицы на второй странице. Необходимо извлечь вторую таблицу и сохранить эту таблицу в CSV. 

Решение: воспользоваться действиями "Извлечь таблицу", "Сохранить таблицу в CSV". 

Реализация:

  1. Собрать схему робота, состоящую из действий:

  2. Настроить параметры для действия "Извлечь таблицу". 

  3. Настроить параметры действия "Сохранить таблицу в CSV". 

  4. Нажать на кнопку "Старт" в верхней панели. 

Результат:

Программный робот отработал успешно. 


 Таблица извлечена из документа-PDF и сохранена в формат CSV.

 


  • Нет меток