Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Действие распознает текст  документа, разделяет его на блоки и сохраняет в табличном виде.


Настройки

Свойство

Описание

Тип

Пример заполнения

Обязательность заполнения поля

Параметры

Путь к файлу

Путь к файлу, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png, tif, pdf.

Robin.FilePath


Да

Номер страницы

Номер страницы в документе, с которой нужно извлечь данные. Если поле не заполнено, данные будут извлечены со всех страниц.

Robin.Numeric


Нет

Язык

Предполагаемый язык текста, который необходимо извлечь.

Robin.String


Нет

Алгоритм

Если выбран «Текст», действие распознает только текстовые данные. Если «Таблица», действие распознает только табличные данные. Если «Текст и таблица», действие распознает любые данные.

Robin.String


Да

Расстояние между словами

Максимальное расстояние между словами в текстовых данных документа. Используется для деления текста на столбцы в результирующей таблице. Значение по умолчанию - 20 пикселей.

Robin.Numeric


Нет

Расстояние между строками

Максимальное расстояние между строками в текстовых данных документа. Используется для деления текста на строки в результирующей таблице. Значение по умолчанию - 1 пиксель.

Robin.Numeric


Нет

Путь к папке

Путь к папке, в которую будет сохранено изображение страницы документа с наложенными блоками, на которые действие разделило данные. Для сохранения файла также нужно заполнить поле «Имя файла».

Robin.FolderPath

C:\doc\img

Нет

Имя файла

Название изображения страницы документа с наложенными блоками (без расширения). Если действие извлекает данные с нескольких страниц, то на каждую из них будет создан отдельный файл, к названию которого будет добавлен индекс. Для сохранения файла также нужно заполнить поле «Путь к папке».

Robin.String


Нет

Перезаписать

Если значение «true», и в указанной папке существует файл изображения с таким же именем, индексом и расширением, то новый файл его перезапишет. Если «false», файл перезаписан не будет и действие вернет ошибку.

Robin.Boolean

true

Нет

Параметры

Дополнительные параметры, влияющие на результат и качество распознавания текста.

Robin.String


Нет

Подписать

Если значение «true», то перед каждой распознанной табличной или текстовой частью будет добавлено слово «Part» c порядковым номером этой части. Если значение «false», перед этими частями будет вставлена пустая строка.

Robin.Boolean

true

Нет

Результаты

Таблица

Таблица, сформированная на основе данных, извлеченных из исходного документа.

Robin.DataTable



Изображение с блоками

Коллекция путей к файлам изображений страниц документа с наложенными блоками.

Robin.Collection





Особые условия использования 

...

Примеры таких документов: кассовые чеки; документы, содержащие табличные данные с\без разделителей; документы, содержащие сплошной текст. 


Пример

...

Image RemovedImage Removed

Пример использования 


Задача: распознать информацию с изображения счета по оплату и записать результат в таблицу в формате CSV. 

...