Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Извлечь таблицу Версия 2 (Python)

Группа действий: PDF

...

Описание

Действие возвращает таблицу с указанной страницы PDF-документа.

...

Image Added

Image Removed

Настройки

Свойство

Описание

Тип

Пример заполнения

Обязательность заполнения поля

Параметры

Путь к файлу

Путь к PDF-файлу, из которого необходимо извлечь таблицу.

Robin.FilePath


Да

Начальная страница

Страница в документе, с которой начинается таблица. Нумерация начинается с 1. Значение по умолчанию 1.

Robin.Numeric


Нет

Конечная страница

Страница в документе, на которой заканчивается таблица

Robin.Numeric


Нет

Номер таблицы

Порядковый номер таблицы в документе на указанной странице. Нумерация начинается с 1. Значение по умолчанию 1.

Robin.Numeric


Нет

С заголовком

Если значение «true», первая строка таблицы будет выделена отдельно как заголовок и не будет входить в строки с содержимым таблицы.

Robin.Boolean

true

Нет

Убрать дубли заголовка

Если значение «true», в заголовке полученной таблицы к одинаковым названиям столбцов будут добавлены индексы. Нумерация начинается с 1.

Robin.Boolean

true

Нет

Результаты

Таблица

Таблица, сформированная на основе данных, извлеченных из исходного документа.

Robin.DataTable



Особые условия использования

Действие работает только с текстовым слоем.  

Пример использования 

Задача: в документе-PDF имеется 2 таблицы на второй странице. Необходимо извлечь вторую таблицу и сохранить эту таблицу в CSV. 

Image RemovedImage Added

Решение: воспользоваться действиями "Извлечь таблицу", "Сохранить таблицу в CSV". 

...

  1. Собрать схему робота, состоящую из действий:
    Image AddedImage Removed
  2. Настроить параметры для действия "Извлечь таблицу". 
    Image AddedImage Removed
  3. Настроить параметры действия "Сохранить таблицу в CSV". 
    Image AddedImage Removed
  4. Нажать на кнопку "Старт" в верхней панели. 

...

Программный робот отработал успешно. 

Image RemovedImage Added


 Таблица извлечена из документа-PDF и сохранена в формат CSV.

 Image RemovedImage Added