D:
In che modo le nuove funzionalità di apprendimento automatico consentono l'estrazione di documenti di magazzino per i dati finanziari?
UN:Una delle nuove entusiasmanti frontiere dell'apprendimento automatico e dell'intelligenza artificiale è che scienziati e ingegneri stanno intraprendendo vari modi per utilizzare tipi di risorse completamente nuovi per prevedere la circolazione delle scorte e i risultati di investimento. Questo è un enorme cambiamento nel mondo finanziario e rivoluzionerà le strategie di investimento in modo molto profondo.
Una delle idee di base per espandere questo tipo di ricerca di borsa è la linguistica computazionale, che prevede la modellizzazione del linguaggio naturale. Gli esperti stanno studiando come utilizzare documenti di testo, dai documenti SEC alle lettere degli azionisti ad altre risorse di testo periferiche, al fine di migliorare o perfezionare l'analisi delle scorte o di sviluppare analisi completamente nuove.
Download gratuito: Machine Learning e perché è importante |
L'importante dichiarazione di non responsabilità è che tutto ciò è reso possibile solo attraverso i nuovissimi progressi nelle reti neurali, l'apprendimento automatico e l'analisi del linguaggio naturale. Prima dell'avvento di ML / AI, le tecnologie informatiche utilizzavano principalmente la programmazione lineare per "leggere" input. I documenti di testo erano troppo non strutturati per essere utili. Ma con i progressi compiuti nell'analisi del linguaggio naturale negli ultimi anni, gli scienziati stanno scoprendo che è possibile "estrarre" il linguaggio naturale per ottenere risultati quantificabili o, in altre parole, risultati che possono essere calcolati in qualche modo.
Alcune delle migliori prove ed esempi più utili di questo provengono da varie tesi di laurea e lavoro di dottorato disponibili sul web. In un documento, "Applicazioni dell'apprendimento automatico e della linguistica computazionale in economia finanziaria", pubblicato nell'aprile 2016, Lili Gao spiega in modo adeguato i processi rilevanti specifici per il mining di documenti SEC aziendali, chiamate degli azionisti e messaggi sui social media.
"Estrarre segnali significativi da dati di testo non strutturati e ad alta dimensione non è un compito facile", scrive Gao. "Tuttavia, con lo sviluppo dell'apprendimento automatico e delle tecniche linguistiche computazionali, è possibile eseguire attività di elaborazione e analisi statistica di documenti testuali e molte applicazioni dell'analisi statistica del testo nelle scienze sociali hanno dimostrato di avere successo." Dalla discussione di Gao sulla modellazione e la calibrazione in astratto, l'intero documento sviluppato mostra come alcuni di questo tipo di analisi funzionino in dettaglio.
Altre fonti per progetti attivi includono pagine come questa descrizione del progetto GitHub e questa risorsa IEEE che parla specificamente di come ottenere preziose informazioni finanziarie da "Analisi del sentiment di Twitter".
La linea di fondo è che l'uso di questi nuovi modelli di PNL sta guidando una rapida innovazione nell'uso di tutti i tipi di documenti di testo, non solo per l'analisi finanziaria, ma per altri tipi di scoperta all'avanguardia, offuscando quella linea tradizionalmente stabilita tra "linguaggio" e "dati."