jTessBoxEditor - Редактор данных для Tesseract OCR
jTessBoxEditor - это программа, которая помогает пользователям работать с системой оптического распознавания символов Tesseract OCR. Она предоставляет инструменты для редактирования Box-файлов и автоматизирует процесс обучения Tesseract распознаванию текста.
Требования и поддержка форматов
Для работы jTessBoxEditor требуется установленная Java. Программа поддерживает множество популярных форматов изображений, таких как TIFF, JPEG, GIF, PNG, BMP, а также может работать с многостраничными TIFF и PDF файлами.
Запуск и использование
jTessBoxEditor можно запустить без установки, просто открыв JAR файл из архива. Программа работает с TIFF и Box файлами. Для обучения Tesseract OCR необходимо, чтобы разрешение изображений было не менее 300 DPI.
Функции редактора
Редактор предоставляет базовый набор горячих клавиш для удобства редактирования. Пользователи могут перемещать и изменять размер полей, переключаться между полями и редактировать символы.
Генерация файлов для обучения
После создания текстов для каждого введенного UTF-8 файла, редактор генерирует соответствующие пары файлов TIFF/Box. Эти файлы можно использовать для обучения Tesseract OCR. Пользователи также могут настроить отслеживание букв и расстояние между символами, чтобы избежать наложения рамок.
Преимущества программы
- Поддержка широкого спектра форматов изображений, включая PDF.
- Возможность работы без установки.
- Автоматизация обучения Tesseract OCR распознаванию шрифтов.
Похожие программы
Категория | Другие графические инструменты |
Версия | 2.5.0 |
Разработчик | Quan Nguyen |
Размер | 89.4 MB |
Лицензия | Apache License 2.0 |
ОС |
|