Mentre effettuavo una ricerca su algoritmi per text clustering ho scoperto Carrot2, un Search Results Clustering Engine Open Source. Carrot può organizzare automaticamente collezioni di documenti, ad esempio può organizzare i risultati di una ricerca in categorie tematiche.
Risultati di ricerca clusterizzati con Carrot2 (live demo)
Oltre a due algoritmi di document clustering, Carrot2 offre componenti pronti all'uso per prevelare i risultati di ricerca da varie sorgenti, inclusi YahooAPI, GoogleAPI, MSN Live API, eTools Meta Search, Lucene, SOLR, Google Desktop e non solo.
Carrot2 è implementato in Java, ma si integra facilmente con software non-Java, come PHP, Ruby o C#.
Nessun commento:
Posta un commento