Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Действие распознает текст  документа, разделяет его на блоки и сохраняет в табличном виде.


Настройки

Свойство

Англ. наименование

Описание

Тип

Пример заполнения

Обязательность заполнения поля

Параметры

Путь к файлу

Path to fileC:\Users\Документы\1.pdf

Путь к файлу, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png, tif, pdf.

Путь к файлу

Robin.FilePath


Да

Номер страницы

Page number

Номер страницы в

многостраничном

документе,

данные

с которой нужно извлечь

в таблицуЧисло

данные. Если поле не заполнено, данные будут извлечены со всех страниц.

Robin.Numeric


Нет

Язык

Language

Выпадающий список из элементов: Русский язык, Английский язык, Русский и английский языки, Испанский язык, Португальский язык. Значение по умолчанию - Русский и английский языки.

Предполагаемый язык текста, который необходимо распознать

СтрокаНет

Предполагаемый язык текста, который необходимо извлечь.

Robin.String


Нет

Алгоритм

Если выбран «Текст», действие распознает только текстовые данные. Если «Таблица», действие распознает только табличные данные. Если «Текст и таблица», действие распознает любые данные.

Robin.String


Да

Расстояние между словами

Максимальное расстояние между словами в текстовых данных документа. Используется для деления текста на столбцы в результирующей таблице. Значение по умолчанию - 20 пикселей.

Robin.Numeric

Расстояние между словами
Distance between words
Максимальное расстояние между словами в пикселях для разделения блоков текста на столбцы таблицы. По умолчанию действие использует расстояние в 20 пикселейЧисло


Нет

Расстояние между строками

Line spacing

Максимальное

расстояние

расстояние между строками в

пикселях для разделения блоков

текстовых данных документа. Используется для деления текста на строки

таблицы. По умолчанию действие использует расстояние в

в результирующей таблице. Значение по умолчанию - 1 пиксель.

Число

Robin.Numeric


Нет

Путь к папке

Folder path
С учетом выбранного расстояния между словами и строками, действие делит распознаваемый текст на блоки. В поле можно указать путь

Путь к папке, в которую будет сохранено изображение

распознанного текста

страницы документа с наложенными блоками, на которые действие разделило данные. Для сохранения файла также

нужно заполнить поле "Имя файла"

нужно заполнить поле «Имя файла».

Robin.FolderPath

C:\doc\img

Путь к папке

Нет

Имя файла

File name

Название

файла

изображения страницы документа с наложенными блоками (без расширения).

По умолчанию создается файл с расширением *.png. Для сохранения файла также нужно заполнить поле "Путь к папке"

Если действие извлекает данные с нескольких страниц, то на каждую из них будет создан отдельный файл, к названию которого будет добавлен индекс. Для сохранения файла также нужно заполнить поле «Путь к папке».

Robin.String

Строка


Нет

Перезаписать

Overwrite

Если значение

равно True

«true», и в указанной папке существует файл изображения с таким же именем, индексом и расширением, то новый файл его перезапишет. Если

False

«false», файл перезаписан не будет и действие вернет ошибку.

Логический

Robin.Boolean

true

Нет

Параметры

Дополнительные параметры, влияющие на результат и качество распознавания текста.

Robin.String


Нет

Подписать

Если значение «true», то перед каждой распознанной табличной или текстовой частью будет добавлено слово «Part» c порядковым номером этой части. Если значение «false», перед этими частями будет вставлена пустая строка.

Robin.Boolean

true

Нет

Результаты

Таблица

Table

Таблица, сформированная на основе

текста

данных,

извлеченного

извлеченных из исходного документа.

ТаблицаПуть к изображению Путь к файлу изображения

Robin.DataTable



Изображение с блоками

Path to image with blocks

Коллекция путей к файлам изображений страниц документа с наложенными блоками.

Путь к файлу

Robin.Collection





Особые условия использования 

...