Carrot2: инструмент для кластеризации документов
Назначение программы
Carrot2 — это программа для работы с кластеризацией документов, которая помогает выполнять расширенный поиск и организовывать результаты поиска по темам.
Возможности программы
Программа позволяет автоматически кластеризовать результаты поиска с использованием двух алгоритмов: Suffix Tree Clustering и Lingo. Она может получать данные из поисковых систем, которые поддерживают специальные API, таких как Microsoft Bing или PubMed, а также из других источников документов, включая Lucene, Apache Solr и ElasticSearch.
Хотя Carrot2 не имеет встроенных функций обхода веб-сайтов и индексации, она поддерживает несколько проектов, которые могут заменить эти функции. Например, Nutch можно использовать для обхода веб-сайта, а Lucene или Solr — для индексации или поиска контента.
Программа может работать как отдельное приложение или быть интегрирована в другие приложения на Java. Её функциональность можно расширить, связав её с поддерживаемыми алгоритмами сканирования или индексации.
Скачать с официальной страницы Carrot2Похожие программы
| Категория | Другие программные файлы |
| Разработчик | Stanislaw Osinski & Dawid Weiss |
| Размер | 30.6 MB |
| Лицензия | BSD License |
| ОС |
|
| Нейросеть подберет аналоги Carrot2 | |