Прочитать текст / Read text
Данное действие предназначено для распознавания печатного текста в заданной области и сохранения распознанного текста в переменную.
Настройки
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
Изображение | Image | Путь к файлу изображения. Поддерживаемые форматы изображений: (jpeg, jpg, bmp, png, tif, tiff) | Изображение | Область_текста | Да |
Ожидаемые языки текста на изображении | Expected languages of text in the image | Ожидаемые языки текста на изображении Выпадающий список из значений:
| Строка | Русский язык | Да |
Формат контента | Content format | Ожидаемый формат текста. Доступные форматы текста: (Line, Block, Page) Выпадающий список из значений:
| Строка | Строка | Да |
Параметры | Options | Параметры конфигурации для распознавания текста | Строка | --psm 10 --oem 3 -c tessedit_char_whitelist=0123456789 | Нет |
Результаты | |||||
Особые условия использования
Отсутствуют.
Получить текст из PDF / Read text from PDF
Данное действие предназначено для распознавания текста из указанной страницы PDF документа и сохранения распознанного текста в переменную.
Настройки
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
Источник | Source | Путь к PDF файлу для распознавания. Если тип файла неприменим, будет выведено предупреждение. | Путь к файлу | C:\Users\Документы\1.pdf | Да |
Основной язык | Primary language | Языки, который распознаватель ожидает в тексте. Выпадающий список: Справочник содержит следующие значения:
По умолчанию значение равно "Русский". !!! Реализация списком временная. После подготовки тулзы с возможностью выбрать несколько элементов одновременно (на базе типа Robin.Collection), тип параметра и реализация его ввода будут изменены. | Строка | Русский | Да |
Страница документа | Document page | Номер станицы файла, с которой будет считываться текст. Если документ не содержит указанной страницы, ошибки не будет, будет пустой результат. | Число | 2 | Да |
Результаты | |||||
Результат | Result | Переменная, в которую будет сохранен распознанный текст. Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение. | Строка |
Особые условия использования
Отсутствуют.
Найти страницу в PDF / Find page in PDF
Данное действие предназначено для поиска страницы по введенному значению и получение ее номера.
Настройки
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
Путь к файлу | Path to file | Путь к PDF-файлу, страница которого будет использована для распознавания. | Путь к файлу | C:\Users\Документы\1.pdf | Да |
Основной язык | Primary language | Язык, который распознаватель ожидает в тексте. По умолчанию значение равно "Русский". Выпадающий список. Справочник содержит следующие значения:
!!! После появления соответствующей тулзы, пользователь будет иметь возможность выбрать несколько языков. | Коллекция | Русский | Да |
Текст | Text | Текст, который должна содержать страница. | Строка | Загрузить | Да |
Результаты | |||||
Номер страницы | Page number | Переменная, которая будет содержать номера всех найденных страниц. Если страница не будет найдена вывести ошибку: "Не найдена страница, содержащая заданный текст." | Коллекция |
Особые условия использования
Отсутствуют.