История страницы
...
Действие распознает текст документас документа, разделяет его на блоки и сохраняет возвращает в табличном виде. Распознавание происходит при помощи Robin OCR 1.
Настройки
Свойство | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
Параметры | ||||
Путь к файлу | Путь к файлу, из которого нужно извлечь данные. Поддерживаемые форматы: jpg, jpeg, bmp, png, tif, pdf. | Robin.FilePath | Да | |
Номер страницы | Номер страницы в документе, с которой нужно извлечь данные. Если поле не заполнено, данные будут извлечены со всех страниц. | Robin.Numeric | Нет | |
Язык | Предполагаемый язык текста, который необходимо извлечь. | Robin.String | Нет | |
Алгоритм | Если выбран «Текст», действие распознает только текстовые данные. Если «Таблица», действие распознает только табличные данные. Если «Текст и таблица», действие распознает любые данные. | Robin.String | Да | |
Расстояние между словами | Максимальное расстояние между словами в текстовых данных документа. Используется для деления текста на столбцы в результирующей таблице. Значение по умолчанию - 20 пикселей. | Robin.Numeric | Нет | |
Расстояние между строками | Максимальное расстояние между строками в текстовых данных документа. Используется для деления текста на строки в результирующей таблице. Значение по умолчанию - 1 пиксель. | Robin.Numeric | Нет | |
Путь к папке | Путь к папке, в которую будет сохранено изображение страницы документа с наложенными блоками, на которые действие разделило данные. Для сохранения файла также нужно заполнить поле «Имя файла». | Robin.FolderPath | C:\doc\img | Нет |
Имя файла | Название изображения страницы документа с наложенными блоками (без расширения). Если действие извлекает данные с нескольких страниц, то на каждую из них будет создан отдельный файл, к названию которого будет добавлен индекс. Для сохранения файла также нужно заполнить поле «Путь к папке». | Robin.String | Нет | |
Перезаписать | Если значение «true», и в указанной папке существует файл изображения с таким же именем, индексом и расширением, то новый файл его перезапишет. Если «false», файл перезаписан не будет и действие вернет ошибку. | Robin.Boolean | true | Нет |
Параметры | Дополнительные параметры, влияющие на результат и качество распознавания текста. | Robin.String | Нет | |
Подписать | Если значение «true», то перед каждой распознанной табличной или текстовой частью будет добавлено слово «Part» c порядковым номером этой части. Если значение «false», перед этими частями будет вставлена пустая строка. | Robin.Boolean | true | Нет |
Результаты | ||||
Таблица | Таблица, сформированная на основе данных, извлеченных из исходного документа. | Robin.DataTable | ||
Изображение с блоками | Коллекция путей к файлам изображений страниц документа с наложенными блоками. | Robin.Collection |
...