Sommario:
- Definizione: che cosa significa Rilevamento della conoscenza nei database (KDD)?
- Techopedia spiega la scoperta della conoscenza nei database (KDD)
Definizione: che cosa significa Rilevamento della conoscenza nei database (KDD)?
La scoperta della conoscenza nei database (KDD) è il processo di scoperta di conoscenze utili da una raccolta di dati. Questa tecnica di data mining ampiamente utilizzata è un processo che include la preparazione e la selezione dei dati, la pulizia dei dati, l'incorporamento delle conoscenze precedenti sui set di dati e l'interpretazione di soluzioni accurate dai risultati osservati.
Le principali aree di applicazione di KDD includono marketing, rilevamento di frodi, telecomunicazioni e produzione.
Techopedia spiega la scoperta della conoscenza nei database (KDD)
Tradizionalmente, il data mining e la scoperta della conoscenza venivano eseguiti manualmente. Con il passare del tempo, la quantità di dati in molti sistemi è cresciuta fino a superare le dimensioni dei terabyte e non è più possibile gestirla manualmente. Inoltre, per la corretta esistenza di qualsiasi attività commerciale, la scoperta di modelli sottostanti nei dati è considerata essenziale. Di conseguenza, sono stati sviluppati numerosi strumenti software per scoprire dati nascosti e fare ipotesi, che facevano parte dell'intelligenza artificiale.
Il processo KDD ha raggiunto il suo apice negli ultimi 10 anni. Oggi ospita diversi approcci alla scoperta, tra cui l'apprendimento induttivo, le statistiche bayesiane, l'ottimizzazione semantica delle query, l'acquisizione di conoscenze per sistemi esperti e la teoria dell'informazione. L'obiettivo finale è quello di estrarre conoscenze di alto livello da dati di basso livello.
KDD include attività multidisciplinari. Ciò comprende l'archiviazione e l'accesso ai dati, il ridimensionamento degli algoritmi in enormi set di dati e l'interpretazione dei risultati. Il processo di pulizia e accesso ai dati incluso nel data warehousing facilita il processo KDD. L'intelligenza artificiale supporta anche KDD scoprendo le leggi empiriche dalla sperimentazione e dalle osservazioni. I modelli riconosciuti nei dati devono essere validi per i nuovi dati e possedere un certo grado di certezza. Questi schemi sono considerati nuove conoscenze. I passaggi coinvolti nell'intero processo KDD sono:
- Identificare l'obiettivo del processo KDD dal punto di vista del cliente.
- Comprendere i domini dell'applicazione coinvolti e le conoscenze richieste
- Selezionare un set di dati di destinazione o un sottoinsieme di campioni di dati su cui viene eseguito il rilevamento.
- Pulisci e preelabora i dati decidendo le strategie per gestire i campi mancanti e modificare i dati secondo i requisiti.
- Semplifica i set di dati rimuovendo le variabili indesiderate. Quindi, analizzare le funzioni utili che possono essere utilizzate per rappresentare i dati, a seconda dell'obiettivo o dell'attività.
- Abbina gli obiettivi KDD ai metodi di data mining per suggerire modelli nascosti.
- Scegli algoritmi di data mining per scoprire modelli nascosti. Questo processo include la decisione di quali modelli e parametri potrebbero essere appropriati per il processo KDD complessivo.
- Cerca modelli di interesse in una particolare forma rappresentativa, che includono regole di classificazione o alberi, regressione e raggruppamento.
- Interpreta le conoscenze essenziali dai modelli estratti.
- Usa la conoscenza e incorporala in un altro sistema per ulteriori azioni.
- Documentalo e fai relazioni per le parti interessate.
