Sommario:
Definizione - Cosa significa Apache Lucene?
Apache Lucene è un progetto open source per una libreria di motori di ricerca di testo ad alte prestazioni e con funzionalità complete, scritta interamente con Java.
È in grado di effettuare ricerche full-text all'interno dei documenti, quindi è una tecnologia adatta a qualsiasi applicazione che richiede questa funzionalità, soprattutto se è multipiattaforma.
È stato sviluppato per la prima volta da Doug Cutting nel 1999 ed è diventato ufficialmente parte della famiglia di progetti Java open source Jakarta Foundation di Apache nel settembre 2001. Nel febbraio 2005 è stato aggiornato a un progetto Apache di alto livello.
Techopedia spiega Apache Lucene
Apache Lucene è un motore di ricerca ad alte prestazioni con il concetto di "un documento contenente campi di testo" nella sua architettura logica di base. Ciò offre una grande flessibilità e consente all'API Lucene di diventare indipendente da qualsiasi formato di file.
Qualsiasi testo proveniente da formati come MS Word, HTML, XML, PDF e OpenDocument può essere indicizzato purché sia possibile estrarre le informazioni testuali, il che significa che non può fare nulla con le immagini.
Lucene è adatto a qualsiasi applicazione che necessiti di una funzionalità di indicizzazione e ricerca full-text, ma è ampiamente riconosciuta come una grande utilità per l'implementazione di motori di ricerca su Internet e per la ricerca locale in un unico sito.
Le caratteristiche includono:
- Indicizzazione scalabile e ad alte prestazioni: può elaborare oltre 150 Gb all'ora su hardware moderno e richiede solo 1 Mb per heap di requisiti di memoria.
- Algoritmi di ricerca potenti, accurati ed efficienti: offre molti tipi di query potenti come query a frase, caratteri jolly, prossimità e intervallo. Ha anche messo in campo la ricerca e l'ordinamento per qualsiasi campo.
- Cross platform: pura implementazione Java e disponibile anche in altri linguaggi di programmazione.
