Иконка программы jTessBoxEditor

jTessBoxEditor - Редактор данных для Tesseract OCR

jTessBoxEditor - это программа, которая помогает пользователям работать с системой оптического распознавания символов Tesseract OCR. Она предоставляет инструменты для редактирования Box-файлов и автоматизирует процесс обучения Tesseract распознаванию текста.

Требования и поддержка форматов

Для работы jTessBoxEditor требуется установленная Java. Программа поддерживает множество популярных форматов изображений, таких как TIFF, JPEG, GIF, PNG, BMP, а также может работать с многостраничными TIFF и PDF файлами.

Запуск и использование

jTessBoxEditor можно запустить без установки, просто открыв JAR файл из архива. Программа работает с TIFF и Box файлами. Для обучения Tesseract OCR необходимо, чтобы разрешение изображений было не менее 300 DPI.

Функции редактора

Редактор предоставляет базовый набор горячих клавиш для удобства редактирования. Пользователи могут перемещать и изменять размер полей, переключаться между полями и редактировать символы.

Генерация файлов для обучения

После создания текстов для каждого введенного UTF-8 файла, редактор генерирует соответствующие пары файлов TIFF/Box. Эти файлы можно использовать для обучения Tesseract OCR. Пользователи также могут настроить отслеживание букв и расстояние между символами, чтобы избежать наложения рамок.

Преимущества программы

  • Поддержка широкого спектра форматов изображений, включая PDF.
  • Возможность работы без установки.
  • Автоматизация обучения Tesseract OCR распознаванию шрифтов.

Скачать с официальной страницы jTessBoxEditor

Похожие программы

Автор статьи: Аркадий Кузнецов

Фото автора

Категория Другие графические инструменты
Версия 2.5.0
Разработчик Quan Nguyen
Размер 89.4 MB
Лицензия Apache License 2.0
ОС
  • Windows 10
  • Windows 8
  • Windows 7
  • Windows Vista
  • Windows XP