Иконка программы Norconex HTTP Collector

Norconex HTTP Collector: быстрый поиск информации в интернете

Поисковые системы помогают быстро находить нужную информацию в интернете. Программа Norconex HTTP Collector — это вспомогательный инструмент, который позволяет быстро сканировать сайты и сохранять результаты на компьютере или отправлять их сразу в поисковую систему.

Программа поддерживает многопоточные операции, что позволяет получать результаты за короткое время. Это особенно полезно при работе с большими сайтами.

После того как цель задана, программа автоматически пытается определить язык сайта. Она может извлекать текст из всех прикреплённых изображений и PDF-файлов благодаря поддержке OCR-задач. Также поддерживаются другие форматы, такие как HTML и документы Office. Программа может обрабатывать канонические URL-адреса.

При запуске заданий можно настроить несколько параметров, например, скорость сканирования. Можно настроить программу так, чтобы она обрабатывала встроенные документы как отдельные файлы и создавала иерархические поля.

Фильтрацию выходных документов можно выполнять на основе URL-адресов или заголовков HTTP. Для этого также можно использовать метаданные.

Для удобства использования доступно несколько примеров, которые позволяют разработчикам и пользователям оценить возможности инструмента.

Скачать с официальной страницы Norconex HTTP Collector

Похожие программы

Автор статьи: Аркадий Кузнецов

Фото автора

Категория Другие интернет-утилиты
Версия 3.0.2
Разработчик Norconex
Размер 102 MB
Лицензия Apache License 2.0
ОС
  • Windows 11
  • Windows 10 32/64 bit
  • Windows 8 32/64 bit
  • Windows 7 32/64 bit
  • Windows Vista 32/64 bit