История страницы
...
По умолчанию в поле "Параметры" используется режим --psm 3. Все параметры перечисляются через пробел в формате --параметр значение_параметра. Список всех параметров: https://muthu.co/all-tesseract-ocr-options/.
Параметр | Значение по умолчанию | Описание |
---|---|---|
Основные параметры | ||
oem | 3 |
|
psm | 3 |
|
Дополнительные параметры | ||
edges_min_nonhole | 14 | Минимальное число пикселей бокса для распознавания |
textord_space_size_is_variable | 0 | Если задано значение true (1), предполагается, что пробелы разделителей слов имеют переменную ширину, даже если символы имеют фиксированный шаг |
textord_tabfind_find_tables | 1 | Запустить детектирование таблиц |
textord_force_make_prop_words | 0 | Применить пропорциональную сегментацию слов во всех строках |
textord_width_limit | 8 | Максимальная ширина блоков для создания строк |
tessedit_pageseg_mode | 6 |
|
textord_max_noise_size | 7 | Максимальный размер шума в пикселях |
tessedit_dont_blkrej_good_wds | 0 | Если задано значение true (1), используется показатель качества сегментации слов |
tessedit_char_blacklist | Черный список символов, которые нельзя распознать | |
tessedit_char_whitelist | Белый список символов для распознавания | |
List of chars to override tessedit_char_blacklist | Список символов для переопределения tessedit_char_blacklist |
...