Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

  • только текстовый слой pdf-документа
  • только изображения
  • и текстовый слой, и изображения.

Работа действия основана на алгоритме извлечения блоков текста документа. Слова и строки документа объединяются в блоки на основе максимального расстояния между словами и максимального расстояния между строками. Эти параметры задаются во входных параметрах действия.

...

  1. Собрать схему робота, состоящего из действий:

  2. Настроить параметры для действия "Извлечь данные в таблицу". 
    Image RemovedImage Added
  3. Настроить параметры для действия "Сохранить таблицу в CSV". 
    Image RemovedImage Added
  4. Нажать на кнопку "Старт" в верхней панели. 

...

Программный робот отработал успешно. Данные с документа извлечены в таблицу формата CSV. 

Image RemovedImage Added

Страницы из документа сохранены в формате .png в указанную папку с выделенными блоками.

Image AddedImage RemovedImage Removed


Таблица излечена и сохранена в формате .csv Новая таблица.csv

...