Norconex HTTP Collector: быстрый поиск информации в интернете
Поисковые системы помогают быстро находить нужную информацию в интернете. Программа Norconex HTTP Collector — это вспомогательный инструмент, который позволяет быстро сканировать сайты и сохранять результаты на компьютере или отправлять их сразу в поисковую систему.
Программа поддерживает многопоточные операции, что позволяет получать результаты за короткое время. Это особенно полезно при работе с большими сайтами.
После того как цель задана, программа автоматически пытается определить язык сайта. Она может извлекать текст из всех прикреплённых изображений и PDF-файлов благодаря поддержке OCR-задач. Также поддерживаются другие форматы, такие как HTML и документы Office. Программа может обрабатывать канонические URL-адреса.
При запуске заданий можно настроить несколько параметров, например, скорость сканирования. Можно настроить программу так, чтобы она обрабатывала встроенные документы как отдельные файлы и создавала иерархические поля.
Фильтрацию выходных документов можно выполнять на основе URL-адресов или заголовков HTTP. Для этого также можно использовать метаданные.
Для удобства использования доступно несколько примеров, которые позволяют разработчикам и пользователям оценить возможности инструмента.
Скачать с официальной страницы Norconex HTTP CollectorПохожие программы
Категория | Другие интернет-утилиты |
Версия | 3.0.2 |
Разработчик | Norconex |
Размер | 102 MB |
Лицензия | Apache License 2.0 |
ОС |
|