Получить текст из PDF / Read text from PDF
Группа действий: Распознавание текста
Данное действие предназначено для распознавания текста из указанной страницы PDF документа и сохранения распознанного текста в переменную.
Настройки
Свойство | Англ. наименование | Описание | Тип | Пример заполнения | Обязательность заполнения поля |
---|---|---|---|---|---|
Параметры | |||||
Источник | Source | Путь к PDF файлу для распознавания. Если тип файла неприменим, будет выведено предупреждение. | Путь к файлу | C:\Users\Документы\1.pdf | Да |
Основной язык | Primary language | Языки, который распознаватель ожидает в тексте. Выпадающий список: Справочник содержит следующие значения:
По умолчанию значение равно "Русский". | Строка | Русский | Да |
Страница документа | Document page | Номер станицы файла, с которой будет считываться текст. Если документ не содержит указанной страницы, ошибки не будет, будет пустой результат. | Число | 2 | Да |
Результаты | |||||
Результат | Result | Переменная, в которую будет сохранен распознанный текст. Если изображение не содержит текст или его невозможно прочитать, будет сохранено пустое значение. | Строка |
Особые условия использования
Отсутствуют.
Пример использования
Задача: существует документ в формате pdf , необходимо получить текст с 2 страницы документа.
Решение: воспользоваться действием "Получить текст из PDF".
Реализация:
- Перенести действие "Получить текст из PDF" на рабочую область.
- Настроить параметры действия "Получить текст из PDF"
- Нажать на кнопку "Старт" в верхней панели.
Результат:
Программный робот отработал успешно. Текст со 2 страницы документа получен.