Переходите на новый сайт Базы знаний. Актуализация контента происходит теперь там.

Tesseract провайдер
Активность предназначена для создания провайдера, который будет использован в других активностях.
Свойства
  • Язык - язык для распознавания. Дополнительные языковые пакеты требуется скачивать и размещать в папку установки Pix;
  • Масштаб - коэффициент масштабирования изображения (от 0 до 1 - уменьшение размера в пикселях, больше - увеличение);
  • Исправить перекос - определить перекос изображения и исправить его, если он достаточно высок;
  • В градациях серого - Преобразование изображения в режим градаций серого (8 бит на пиксель). Данный режим необходим для корректной работы некоторых других фильтров, таких как удаление линий или шума;
  • Удалить линии - удалить горизонтальные линии с изображения в градациях серого. Алгоритм основан на Leptonica;
  • Удалить шум - удалить шум с изображения в градациях серого. Алгоритм основан на Leptonica.
  • Движок - Движок OCR:
  1. TesseractOnly - только классический Tesseract,
  2. LstmOnly - только LSTM (на основе нейронных сетей),
  3. TesseractAndLstm - гибрид Tesseract и LSTM,
  4. Default - по умолчанию (LSTM).
  • Режим сегментации страниц - представляет возможные режимы анализа макета страниц:
  1. OsdOnly - определение ориентации и скрипта (OSD),
  2. AutoOsd - автоматическая сегментация страниц с помощью OSD,
  3. AutoOnly - автоматическая сегментация страниц, но без OSD, или OCR,
  4. Auto - полностью автоматическая сегментация страниц, но не OSD,
  5. SingleColumn - предположение об одном столбце текста переменного размера,
  6. SingleBlockVertText - предположение об одном едином блоке текста, выровненном по вертикали,
  7. SingleBlock - предположение об одном едином блоке текста,
  8. SingleLine - изображение рассматривается как одна строка текста,
  9. SingleWord - изображение рассматривается как одно слово,
  10. CircleWord - изображение рассматривается как одно слово в круге,
  11. SingleChar - изображение рассматривается как один символ,
  12. SparseText - разреженный текст,
  13. SparseTextOsd - разреженный текст с OSD,
  14. RawLine - изображение рассматривается как одна текстовая строка, минуя хаки, характерные для Tesseract.
  • Разрешенные символы - разрешенные символы (whitelist). Заполняются подряд в виде строки;
  • Запрещенные символы - запрещенные символы (blacklist). Заполняются подряд в виде строки;
  • Провайдер - переменная, где будет храниться провайдер для использования в других активностях.