Casa Banche dati Che cos'è apache lucene? - definizione da techopedia

Che cos'è apache lucene? - definizione da techopedia

Sommario:

Anonim

Definizione - Cosa significa Apache Lucene?

Apache Lucene è un progetto open source per una libreria di motori di ricerca di testo ad alte prestazioni e con funzionalità complete, scritta interamente con Java.

È in grado di effettuare ricerche full-text all'interno dei documenti, quindi è una tecnologia adatta a qualsiasi applicazione che richiede questa funzionalità, soprattutto se è multipiattaforma.

È stato sviluppato per la prima volta da Doug Cutting nel 1999 ed è diventato ufficialmente parte della famiglia di progetti Java open source Jakarta Foundation di Apache nel settembre 2001. Nel febbraio 2005 è stato aggiornato a un progetto Apache di alto livello.

Techopedia spiega Apache Lucene

Apache Lucene è un motore di ricerca ad alte prestazioni con il concetto di "un documento contenente campi di testo" nella sua architettura logica di base. Ciò offre una grande flessibilità e consente all'API Lucene di diventare indipendente da qualsiasi formato di file.


Qualsiasi testo proveniente da formati come MS Word, HTML, XML, PDF e OpenDocument può essere indicizzato purché sia ​​possibile estrarre le informazioni testuali, il che significa che non può fare nulla con le immagini.


Lucene è adatto a qualsiasi applicazione che necessiti di una funzionalità di indicizzazione e ricerca full-text, ma è ampiamente riconosciuta come una grande utilità per l'implementazione di motori di ricerca su Internet e per la ricerca locale in un unico sito.


Le caratteristiche includono:

  • Indicizzazione scalabile e ad alte prestazioni: può elaborare oltre 150 Gb all'ora su hardware moderno e richiede solo 1 Mb per heap di requisiti di memoria.
  • Algoritmi di ricerca potenti, accurati ed efficienti: offre molti tipi di query potenti come query a frase, caratteri jolly, prossimità e intervallo. Ha anche messo in campo la ricerca e l'ordinamento per qualsiasi campo.
  • Cross platform: pura implementazione Java e disponibile anche in altri linguaggi di programmazione.
Che cos'è apache lucene? - definizione da techopedia