Carrot2: инструмент для кластеризации документов
Назначение программы
Carrot2 — это программа для работы с кластеризацией документов, которая помогает выполнять расширенный поиск и организовывать результаты поиска по темам.
Возможности программы
Программа позволяет автоматически кластеризовать результаты поиска с использованием двух алгоритмов: Suffix Tree Clustering и Lingo. Она может получать данные из поисковых систем, которые поддерживают специальные API, таких как Microsoft Bing или PubMed, а также из других источников документов, включая Lucene, Apache Solr и ElasticSearch.
Хотя Carrot2 не имеет встроенных функций обхода веб-сайтов и индексации, она поддерживает несколько проектов, которые могут заменить эти функции. Например, Nutch можно использовать для обхода веб-сайта, а Lucene или Solr — для индексации или поиска контента.
Программа может работать как отдельное приложение или быть интегрирована в другие приложения на Java. Её функциональность можно расширить, связав её с поддерживаемыми алгоритмами сканирования или индексации.
Скачать с официальной страницы Carrot2Похожие программы
Категория | Другие программные файлы |
Версия | 4.5.3 |
Разработчик | Stanislaw Osinski & Dawid Weiss |
Размер | 30.6 MB |
Лицензия | BSD License |
ОС |
|