Casa Audio Che cos'è il data mining di testo? - definizione da techopedia

Che cos'è il data mining di testo? - definizione da techopedia

Sommario:

Anonim

Definizione: cosa significa Data Mining di testo?

Il data mining di testo implica la manipolazione di un documento di testo o di una risorsa per ottenere preziose informazioni strutturate. Ciò richiede sofisticati strumenti analitici che elaborano il testo al fine di ottenere parole chiave specifiche o punti chiave dei dati da quelli che sono considerati formati relativamente grezzi o non strutturati.

Il data mining di testo è anche noto come mining di testo o analisi del testo.

Techopedia spiega l'estrazione dei dati di testo

Nel data mining di dati di testo, i sistemi ingegnerizzati utilizzano elementi quali tassonomie e analisi lessicale per determinare quali parti di un documento di testo sono preziose come dati estratti. I modelli statistici sono comunemente utili e i sistemi possono anche usare l'euristica, o congetture algoritmiche, per cercare di determinare quali parti di un testo sono importanti. Altri sistemi di controllo includono il tagging e l'analisi delle parole chiave, in cui gli strumenti cercano nomi propri specifici o altri tag e parole chiave per capire di cosa si sta scrivendo.

Un altro componente unico del text mining è spesso chiamato analisi dei sentimenti. Nell'analisi del sentimento, che è generalmente molto più difficile dell'analisi statistica, gli strumenti analitici cercano di capire l'umore o il sentimento dietro il testo scritto e altri aspetti di ciò che sta affrontando a un livello molto soggettivo e intuitivo. Con l'emergere di strumenti di intelligenza artificiale, sono stati fatti molti progressi nell'analisi del sentiment, in modo tale che il moderno data mining di testo non sia solo la raccolta di riferimenti quantitativi e comporta la creazione di modelli concettuali di alto livello per il text mining per scoprire modi nuovi e unici per aggregare dati preziosi.

Che cos'è il data mining di testo? - definizione da techopedia