Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Примеры таких документов: кассовые чеки; документы, содержащие табличные данные с\без разделителей; документы, содержащие сплошной текст. 

 Основные положения:

  1. На движке tesseract.
  2. За раз действие распознает только 1 страницу одного документа.
  3.  На вход можно дать файл с расширением jpg, jpeg, bmp, png, tif, pdf.
  4. После нахождения всех блоков текста, они упорядочиваются сверху вниз, слева на право и сохраняются в табличную переменную с сохранением изначальной структуры документа.

  5. Если подан одностраничный файл, поле "Номер страницы" будет игнорироваться.
  6. Ячейки могут быть пустыми, так как в некоторых строках 1 столбец, в некоторых два или больше. И следовательно там, где 1 столбец там будет во следующих пустые ячейки.

Сохранение изображения распознанного текста с наложенными блоками.

  • Если поля "Путь к папке", "Имя файла" не заполнены, то файл  с наложенными блоками не сохранится.

  • Если заполнено поле "Путь к папке" и не заполнено "Имя файла", то действие вернет ошибку.

  • Если заполнено поле "Имя файла" и не заполнено "Путь к файлу", то действие вернет ошибку.
  • Если заполнено поле "Имя файла" и  "Путь к файлу", то файл сохраняется в указанной папке с указанным именем в формате *.png.
  • Если в указанной папке уже есть файл с указанным именем и расширением и поле "Перезаписать" = false, то робот вернет ошибку.

Пример распознавания.

 




Пример использования 

...