Di Techopedia Staff, 29 marzo 2017
Da asporto: l' host Eric Kavanagh discute di business intelligence con il Dr. Robin Bloor e Stan Geiger di IDERA.
Al momento non sei collegato. Accedi o registrati per vedere il video.
Eric Kavanagh: Signore e signori, bentornati di nuovo, è mercoledì alle 4:00 Est e per gli ultimi due anni ciò significa che è tempo di Hot Technologies, sì, davvero. Mi chiamo Eric Kavanagh, sarò il tuo ospite per lo spettacolo di oggi. Adoro questo argomento: "Health Check: mantenere una BI aziendale salutare", è di questo che parleremo oggi. C'è davvero un punto nel tuo.
Quindi quest'anno fa caldo - Hot Technologies è stata davvero progettata per definire particolari tipi di tecnologia e puoi immaginare là fuori nel mondo del software aziendale ci sono molti e molti venditori che vendono tutti i tipi di prodotti diversi e ciò che finisce accadendo è lì sono queste parole d'ordine che finiscono per abituarsi e farsi coinvolgere da vari venditori per cose molto diverse. E così, lo scopo di questo spettacolo è davvero aiutare i nostri amici venditori e aiutare il nostro pubblico sia a identificare e avvolgere la nostra testa su quali specifici tipi di tecnologie sono realmente e cosa significano tutte queste parole quando arrivate alle otturazioni.
Quindi, entrerò come uno degli analisti oggi, abbiamo anche il Dr. Robin Bloor sulla linea e Stan Geiger di IDERA. Parliamo rapidamente dell'importanza della business intelligence e dell'analisi in generale. Questo è un albero decisionale di base, se vuoi, o un diagramma di flusso che parla solo di come lavori attraverso i problemi della tua azienda, discutendo su argomenti diversi, mettendo insieme le proposte e poi scopri cosa pensano le persone. Sono d'accordo? Non sono d'accordo? Qual è il consenso, se ne hai, e come lavori attraverso quel processo?
Bene, questo è ovviamente tutto molto generico, ma è un buon promemoria del processo attraverso il quale proponiamo idee nelle aziende, prendiamo le nostre decisioni e poi andiamo avanti. E la linea di fondo è che i dati sono richiesti per ognuno di quei componenti. Oggi è ancora più vero nel mondo dei big data, perché ovviamente i big data sono come questo gigantesco motore di verità là fuori. I big data sono davvero ciò che sta accadendo; è rappresentativo di chi è dove, cosa stanno facendo, cosa stanno comprando, cosa gestiscono i loro social media, ad esempio twittando. Ovviamente, tutte quelle cose possono essere hackerate - bisogna fare attenzione a quello - ma il punto è che i dati sono l'architettura di riferimento, se vuoi, per la realtà.
Quindi, vuoi i dati in ogni punto di questo processo decisionale. Ora, il consenso è importante. Se vuoi utenti felici, a volte un capo potrebbe dover andare contro il grano di ciò che tutti vogliono. Stavamo parlando di Steve Jobs poco prima dell'inizio di questo webcast ed era famoso per quel genere di cose. Ha una famosa citazione in cui raccomanda alle persone di soffocare il rumore che sentono intorno e di attenersi alla loro visione, se sanno che quello che stanno facendo è giusto. Quindi, non è sempre necessario il consenso, ma di solito è una buona idea. Ma lo scopo generale di questa diapositiva e di questo commento è di portare a casa l'importanza che vogliamo prendere le nostre decisioni sulla base dei dati, non solo dell'istinto, sebbene l'intestino sia di solito davvero bravo ad aiutarti a sapere dove vuoi andare, e poi cerchi davvero di convalidarlo o invalidarlo con i tuoi dati. E direi di non aver paura di guardare indietro lì dentro, proprio come un bel pennarello, o di ricordare che quando guardi indietro in qualche occasione puoi almeno ottenere un quadro di riferimento e capire dove sei stato proveniente da ed essere onesti sugli errori che hai commesso. Abbiamo fatto tutti degli errori, succede.
Quindi, se hai problemi di prestazioni nei tuoi sistemi di business intelligence, beh, c'è la vecchia espressione "la pazienza è una virtù", non nel mondo dell'IT, posso dirtelo ora. Se gli utenti stanno aspettando da molto tempo che le loro domande ritornino, o non stiano ottenendo i loro rapporti, ciò erode la fiducia e quando la fiducia è andata via è molto difficile recuperarla. Quindi, ho messo una linea qui - circa 40 secondi in questi giorni è come 40 minuti in molti casi - se una query impiegherà 40 secondi, le persone dimenticano di cosa stanno persino parlando, cosa stavano chiedendo dei dati. Immagina in una conversazione se chiedi a qualcuno, diciamo al tuo capo, dici: "Ehi, mi piacerebbe sapere perché stiamo percorrendo questa strada". E hai dovuto aspettare 40 secondi in una conversazione ottenere una risposta? Usciresti dalla stanza! Penseresti che il tuo capo abbia perso la testa. Quindi, quella latenza che abbiamo in alcuni sistemi di informazione, quando ci sono problemi di prestazioni, che troncerà il processo analitico, il flusso analitico o, come alcuni lo chiamano, la conversazione che stai avendo con i tuoi dati. Devi accelerare in questi sistemi, qualunque cosa tu debba fare per farlo, e ne parleremo oggi, ecco cosa devi fare, perché senza quel flusso fluido di idee avanti e indietro, sei danneggiando davvero l'intero processo di analisi. Quindi, ancora una volta, lancio questo commento: la mancanza di fiducia è un killer silenzioso. Le persone non alzeranno troppo le mani se non si fidano di te, ma ti guarderanno solo lateralmente e si chiederanno cosa stia succedendo. E una volta che la fiducia è scomparsa, avrai un momento molto, molto difficile, per recuperarla.
Quindi, l'intelligenza artificiale, beh, continuiamo a sentir parlare dell'apprendimento automatico e dell'intelligenza artificiale e "Oh, non risolverà tutti questi problemi?" Robin e io sentiamo da anni ormai sui database di auto-tuning e su tutte queste cose divertenti - ce n'è un po ', ma poniti la domanda: con quale frequenza Siri fa la cosa giusta per te? Quante volte Siri è saltato fuori accidentalmente e ha detto: "Mi dispiace, non l'ho capito." Ecco perché non ti stavo chiedendo nulla. Ho appena accidentalmente premuto quel pulsante maledetto. Quindi ci sono ancora molti difetti e, a proposito, sul lato sinistro, questo è il chip ASIC di una Apple Newton - ricordi quel cucciolo di anni e anni fa? Quello è stato uno dei primi dispositivi intelligenti, ed è un po 'di tempo fa, è come nei primi anni '90 o nella metà degli anni '90 che voglio dire. Che il Newton uscì e non fu molto buono, ma ebbe la visione; sapevano dove stavano andando, ma anche ora, con l'IA iPhone e l'apprendimento automatico, questi sono concetti ampiamente fraintesi, direi.
E certamente per quanto riguarda l'apprendimento automatico, può essere molto utile e in realtà può essere utilizzato in alcuni di questi ambienti in cui stai cercando di capire cosa sta succedendo con la tua complessa architettura delle informazioni, dove le cose vanno male. L'apprendimento automatico può essere molto prezioso in quel contesto, ma solo se applicato in modo molto acuto. Quindi, in effetti, ero solo un grande evento in California, uno dei grandi distributori di Hadoop Cloudera aveva il suo summit da analista e stavo parlando con il loro ufficiale di strategia e ho detto: "Sai, mi sembra, che il machine learning in realtà fa solo due cose: si segmenta e perfeziona. ”Significa che ti darà diversi segmenti o gruppi di attività tra cui anomalie, che sarebbe un segmento. E perfeziona, nel senso che ti aiuta a migliorare un certo tipo di decisione. L'esempio classico di cui hai sentito parlare è che c'è un essere umano in questa fotografia, per esempio. Questo è qualcosa che può fare l'apprendimento automatico ed è utile in alcuni contesti, quando si parla di risoluzione dei problemi, perché è possibile cercare modelli di comportamento nell'uso della CPU, nell'uso della memoria, nella velocità del disco e cosa stanno facendo i dischi e tutto quel genere di cose divertenti. Quindi può essere utile, ma è davvero qualcosa che deve essere molto concentrato per generare qualsiasi valore.
Quindi, una delle mie altre cose preferite di cui parlare - e vedremo un po 'di questo, penso, quando prendiamo la nostra demo oggi da IDERA - in molti modi penso che gli esseri umani stiano ancora imparando a parlare di silicio . C'è una scienza dei materiali al di sotto di tutto questo, e per quelli di voi che hanno fatto la risoluzione dei problemi e hanno dato un'occhiata alle architetture di informazioni complesse, quando si sta cercando di capire cosa sta succedendo, anche in un cluster Hadoop, ad esempio, davvero di solito stai solo guardando gli istogrammi. E poi devi correlare il significato di questi diversi istogrammi in un particolare momento nel tempo, e ciò richiede intelligenza; che richiede intelligenza umana ed esperienza. Quindi, non ho paura che ML, l'apprendimento automatico o l'intelligenza artificiale porteranno via presto troppi lavori in questo mondo. Penso che ci sarà sempre bisogno di esseri umani, che francamente sanno di cosa stanno parlando per aiutarci e far sì che tutto ciò accada.
Quindi, continuiamo ad andare avanti. Quindi, cosa succede se non sei guidato dai dati? Questo è un famoso dipinto, "The Blind Leading the Blind" - questo non è quello che stai cercando, gente. Non vuoi questo tipo di ambiente nella tua organizzazione. Quindi quello che vogliamo è che le nostre decisioni siano guidate dai dati e vogliamo che le decisioni siano guidate da dati validi, dati di buona qualità e ciò accadrà solo se si raccolgono i dati corretti, se è bello e pulito, e se i sistemi funzionano correttamente, se i sistemi di BI sono integri, i sistemi di analisi sono integri e gli utenti ottengono ciò che desiderano in modo tempestivo.
Quindi con ciò ho intenzione di concludere e consegnare l'inimitabile Robin Bloor. Robin, portalo via.
Robin Bloor: Okay, grazie per avermi passato la palla. Stavo pensando mentre stavi parlando, Eric, stavo solo pensando alla BI e c'è stata una presentazione del fornitore a cui ho partecipato di recente quando qualcuno ha osservato che in un particolare fornitore, che eseguiva un particolare sistema in un grande magazzino di dati difettosi, in un un dato momento potrebbe fare 70.000 transazioni BI che porterebbero alla presentazione di informazioni a molte persone. Mi è venuto in mente che se in realtà hai quel tipo di carico di lavoro e sprechi anche qualche secondo in termini di esecuzione del software, allora sarà davvero molto costoso e se perdi minuti sarà terribilmente costoso. E poi mi sono ricordato che gran parte del mondo corre su fogli di calcolo - ci sono, penso che fossero chiamati "sistemi ombra", vero? Nel primo caso, in cui le persone avrebbero semplicemente messo insieme sistemi usando fogli di calcolo ed e-mail, e avrebbero fatto accadere le cose, perché il dipartimento IT non poteva creare applicazioni per tutti, quindi in qualche modo lo fanno. E un sacco di BI, penso, viene comunque coinvolta in sistemi del genere.
Comunque, detto questo, cominciamo a parlare di ciò di cui parlerò. La BI è un circuito di feedback per i sistemi aziendali, è davvero così semplice o complicato, a seconda del ruolo che svolge all'interno dell'organizzazione. Ma se guardiamo a questo è un diagramma di circa quattro anni fa, quando stavamo provando in un modo o nell'altro a capire cosa stava succedendo dal lato dell'analisi. Ma praticamente, tutto ciò che è col senno di poi, guardando indietro a ciò che è accaduto in precedenza, e tutto ciò che è sotto controllo, in termini di come funziona il sistema, tende ad essere BI. Non era il caso che la previsione, l'analisi predittiva fosse la BI, ma in realtà sta diventando sempre più il caso. Eric ha menzionato l'apprendimento automatico, un sacco di apprendimento automatico può effettivamente essere eseguito in un modo o nell'altro contro un flusso di dati e può fornire analisi predittive per i prossimi cinque minuti, o anche quasi in tempo reale, in modo da poter rispondere a un cliente, con una conoscenza calcolata di ciò che sta realmente accadendo.
Ma al centro di questo diagramma, l'interno viene dall'analisi. Ciò che accade normalmente è che varie attività analitiche sono puntate su particolari raccolte di dati e qualcosa di nuovo è appreso, la conoscenza è appresa sul business. E quel pezzo di conoscenza viene quindi legato ai processi aziendali che possono alimentarsi da esso. E di solito si manifesta in un modo o nell'altro quando vengono visualizzati gli avvisi di BI o solo varie cose che vengono inserite nei dashboard e così via e così via. Quando lo abbiamo effettivamente fatto, ci sono quattro termini lì e loro finiscono con la parola "vista" che è molto bella. Ma in realtà non è tutto nel campo di ciò che le persone vogliono fare, c'è anche il problema dell'ottimizzazione e l'ottimizzazione non produce analisi semplici. È un problema molto complesso e molti problemi di ottimizzazione non sono unicamente solubili. Puoi solo avere buone soluzioni, non puoi provare di avere una soluzione migliore. E questa è un'area di attività, dove c'è attività in corso, ma lo è meno della maggior parte delle altre aree di analisi. Quindi, la gente dice che viviamo nell'era dell'analitica - beh, lo facciamo rispetto a dieci anni fa, ma può andare molto più lontano di quanto non sia già andato.
Quindi, la generazione della BI, il desiderio di conoscenza genera le richieste degli utenti, che generano progetti di analisi, e i progetti di analisi generano laghi dati, e i laghi dati più analisi generano intuizioni e intuizioni generano BI. Questa è una storia che ho appena raccontato; Ho pensato di scriverlo. Quello che ho fatto qui, intendo, l'intero punto di questa diapositiva e in realtà la maggior parte delle altre diapositive è solo quello di enfatizzare effettivamente quanto sia complesso il mondo della business intelligence. Non è una cosa semplice, avrei potuto rendere questa diapositiva particolare molto più complicata di quanto non sia in realtà, ma in fondo qui hai dati esterni e dati interni che in un modo o nell'altro verranno messi in scena area, che al giorno d'oggi è una specie di data lake, anche se non tutti hanno data lake. E le persone che non hanno necessariamente successo. E poi, c'è un'attività di pulizia ingerita e un'attività di governo richiesta sui dati prima che tu possa davvero usarlo. Quindi, fornisci quei dati e li riferisci o li analizzi e l'analisi porta all'azione.
E se guardi davvero ai vari tipi di analisi esistenti, questa è una lista incredibilmente lunga, ma non è necessariamente una lista completamente completa, è proprio quello che pensavo di scrivere, quando stavo effettivamente creando questa diapositiva. Quindi, ci sono molte cose che succedono in un ambiente BI che visualizzazioni, OLAP, gestione delle prestazioni, scorecard, dashboard, vari tipi di previsioni, data lake, text mining, video mining, cose predittive, c'è una vasta gamma di cose che continua davvero. Se la guardi in un modo diverso, la realtà aziendale, fondamentalmente in realtà questo è un diagramma simile a quello precedente, è appena fatto in un modo diverso. Ho separato ciò che chiameresti BI perché è regolare ed è noto ciò che è richiesto, ciò non significa che ciò che sta realmente accadendo sia efficiente, ma almeno avrai cose regolari che accadono in, diciamo Tableau, o in Click, o in Cognos, c'è una fonte tematica, e così via e così via, vari rapporti o funzionalità regolari continueranno. E poi hai le app di analisi e sono diverse. Perché le app di analisi riguardano davvero l'esplorazione dei dati e, a mio avviso, equivalgono a ricerca e sviluppo. E poi hai il flusso di lavoro. Sotto il flusso di lavoro mescola le tue cose con app operative e app per ufficio, se è necessario - e questa è la realtà aziendale come la vedo io - sebbene nella maggior parte delle organizzazioni non sia così ben organizzata.
Quindi l'interruzione della BI, questo è solo un insieme di cose da menzionare che rende la BI più difficile di una volta, perché il vecchio mondo BI consisteva principalmente in set di dati abbastanza puliti che venivano catturati in un modo o nell'altro, probabilmente da un data warehouse e inseriti in specifici Software di BI. E in quei giorni, sto davvero parlando di cinque o dieci anni fa, ma a quei tempi i volumi di dati non si stavano espandendo, le fonti di dati erano note. La velocità di arrivo dei dati era nota, sebbene spesso alcuni BI non si verificassero abbastanza velocemente per i gusti di alcuni utenti. Non c'erano dati non strutturati, non c'erano quasi dati sociali, certamente nessun dato IoT, non ti importava della provenienza dei dati. Il valore del computer non aveva parallelismo in termini di infrastruttura per poter fare in un modo o nell'altro cose straordinariamente veloci. Non hai avuto l'apprendimento automatico e il numero di carichi di lavoro analitici era piuttosto ridotto. E tutto ciò è cambiato, il volume di dati ora può crescere in modo molto drammatico. Il numero di origini dati che continua a salire. Sì, l'arrivo in streaming dei dati è molto rapido, molti dati non strutturati, sicuramente dati sociali che necessitano di pulizia, ma altri dati che potrebbero necessitare di pulizia, sicuramente dati IoT, sono adesso l'affare.
La provenienza dei dati è un problema e ci preoccupiamo. Il potere del computer è lì, il che è pulito, perché ciò rende possibile ogni sorta di cose, e ora hai l'apprendimento automatico come un fenomeno che porta alla creazione di più capacità di BI e nuovi carichi di lavoro analitici che faranno lo stesso. Quindi, la BI non è una situazione statica e penso che sia l'ultima cosa che dirò, prima di consegnarla a Stan. Oh no, non lo è, c'è qualcos'altro. Paesaggio BI futuro, Internet delle cose, architetture guidate dagli eventi, tutto in tempo reale, OK. Questo è abbastanza BI dell'utente, da parte dell'utente, per l'utente i problemi in sintesi. Tempestività delle prestazioni del flusso di dati, copertura dei dati, pulizia dei dati, capacità di accesso ai dati, visualizzazione, condivisibilità e fattibilità.
Quindi ora posso trasmetterlo a Stan, a meno che il servizio BI non sia affidabile e tempestivo, non è un servizio. Stan?
Eric Kavanagh: Va bene, Stan, ti do la palla, portala via.
Stan Geiger: OK. Quindi, quello di cui parlerò è solo il mio background. Sono senior manager di IDERA nella gestione dei prodotti e una delle responsabilità che ho è il nostro prodotto di offerta di business intelligence. Quindi approfondirò un po 'quello di cui parlava Robin e parlare dell'area chiave con la business intelligence sta monitorando la salute della tua piattaforma. È come ha detto, ora era dove avevamo tutti questi dati e ci sarebbero volute settimane per analizzare e poi saremmo tornati con rapporti e cose. Ma il panorama della BI sta cambiando in modo tale che ci stiamo avvicinando all'analisi quasi in tempo reale ora. E in molti casi, analisi in tempo reale. Quindi, parlo un po 'di questa diapositiva, questa è solo una sorta di panoramica - e proprio come una completa divulgazione è che ne parlerò da una prospettiva Microsoft, ma tutti questi concetti spiegano se la tua BI le piattaforme sono in Oracle, oppure stai utilizzando Informatica e Oracle, o semplicemente in modalità ibrida, ambienti ibridi. Userò solo in riferimento all'ambiente Microsoft, ma questo è piuttosto standard.
Robin aveva una diapositiva lì dentro che toccava questo, è che hai sistemi di origine, in cui ho tutti i miei dati archiviati, e ora erano quelli che erano tutti in database relazionali e archiviazione di dati come quello, ma ora abbiamo Hadoop, Internet e cose del genere, e tutti questi dati non strutturati presenti là fuori, e ora possiamo portarli in questa architettura BI. Quindi il livello intermedio parla un po 'è l'archiviazione dei dati in aggregazione; qui è dove inseriamo i dati, potremmo pulirli, potremmo ristrutturarli, quindi inserire un tipo di archivio di dati e quindi il livello di presentazione si colloca al di sopra di quello, ed è qui che gli utenti ottengono l'accesso. E stiamo facendo analisi su quei dati in quegli archivi di dati, e stiamo facendo dashboard e abbiamo Tableau seduto lì, servizi di reportistica, cose del genere. Rido sempre perché quando ero un architetto BA, ridevamo sempre di Excel, perché ammettiamolo, Excel è ancora lo strumento di BI delle masse.
Quindi, un po 'di una panoramica lì, ma solo per parlare del tipo di architettura della piattaforma, hai i tuoi dati di origine e ne ho parlato in più archivi di dati. E poi ho il mio spazio di archiviazione aggregato nel mondo Microsoft, avrai il tuo database SQL Server, forse dov'è il tuo data warehouse, potresti avere il tuo data warehouse nel cloud, con il tuo data warehouse. Hai servizi di analisi, che sono i tuoi tubi OLAP e cose del genere per fare aggregazioni e cose intorno a guardare cose attraverso più dimensioni e cose del genere. Quindi hai il tuo livello di presentazione, di cui ho parlato brevemente, di tutte queste cose che si trovano in cima a quegli archivi di dati e aggregazioni. E mi piace sempre questa frase, "Non sai cosa non sai", il che è vero. Se non stai monitorando e non stai osservando cosa sta succedendo, in tutte queste aree della tua piattaforma BI, come fai a sapere quando hai un problema diverso da quando gli utenti iniziano a inviarti brutte e-mail e il telefono si avvia in merito al motivo per cui i miei rapporti non sono in esecuzione? Perché è tutto così lungo?
Quindi, in tal senso, quello che devi fare, devi essere in grado di monitorare le tue piattaforme da cui stai servendo la business intelligence. E sostanzialmente l'ho suddiviso in tre aree: disponibilità, prestazioni e utilizzo. Disponibilità che indica se la risorsa è disponibile: è attiva o inattiva? Abbastanza semplice lì. Ma anche guardando quando hai, potresti avere la piattaforma potrebbe essere disponibile, ma potresti avere problemi lì, quindi devi essere in grado di fare l'identificazione della causa principale; devi essere in grado di avere un avviso e far sapere a qualcuno cosa sta succedendo, prima che le cose raggiungano uno stato critico. Ciò porta anche al lato delle prestazioni, hai cose da un livello di metrica delle prestazioni, a livello di server, dove sono ospitati i servizi o i servizi di BI o piattaforme BI; hai prestazioni a livello di risorsa dove forse sto accedendo ai dati da una SAN, per esempio. Essendo la SAN la risorsa, le risorse di rete, devi essere in grado di monitorare le prestazioni di tutto ciò, essere in grado di identificare i colli di bottiglia e mantenere felici i tuoi utenti, e se ti trovi in un ambiente in cui stai facendo- analisi del tempo, devi essere in grado di identificare i colli di bottiglia o i problemi prima che inizino a verificarsi.
E l'ultima teoria è l'utilizzo: cosa stanno facendo gli utenti? Chi è connesso alle mie fonti BI? Chi gestisce cosa? Quali query stanno eseguendo? Quali rapporti stanno eseguendo? Conoscere queste informazioni consente, ad esempio, di determinare e svolgere la pianificazione della capacità. Mostra anche ciò che viene utilizzato nel proprio ambiente BI. Avevamo un cliente che desiderava il nostro prodotto di monitoraggio per la BI solo perché sapessero quali parti dell'ambiente BI stavano utilizzando in modo da poter spostare le risorse. Ad esempio, se non stessero utilizzando determinati report o alcuni cubi di servizi di analisi, sposterebbero le risorse da quello ad altre aree che erano altamente utilizzate. Un'altra citazione che mi piace, mi piacciono i film davvero fantastici come “Tremors”, quindi ti dico il mio film, quindi mi piace questa citazione di Burt Gummer, che è stato interpretato da Michael Gross, è una specie di ragazzo sopravvissuto e dice che si presenta e tira fuori questo enorme fucile da cecchino da 50 calibri, e uno dei ragazzi dice "Accidenti, Bert". E lui risponde "Quando ne hai bisogno e non ce l'hai, canti una melodia diversa. "In altre parole, sai una cosa? Era preparato a tutto e venne preparato a tutto, e quindi ciò che intendo con questo è se non stai monitorando il tuo ambiente di BI da risorse, utilizzo e cose di cui ho appena parlato, quindi non ti rendi conto che hai bisogno di uno strumento o un ambiente o una struttura che lo sta monitorando fino a quando non lo si possiede. E poi ti rendi conto che avevo davvero bisogno che andasse avanti, e in un certo senso sono molti i nostri clienti.
Quindi, detto questo, ci sposteremo e daremo uno sguardo a ciò che stiamo facendo qui a IDERA per risolvere alcuni di questi problemi. E-
Eric Kavanagh: Okay, eccoti, lo vedo.
Stan Geiger: Lo vedi? Va bene. Quindi, quello che abbiamo qui è questo è il nostro prodotto BI Manager. E monitoriamo, IDERA è stata tradizionalmente un'azienda nell'ambiente SQL Server, Microsoft SQL Server. E poi abbiamo acquistato in Embarcadero, quindi ora ci siamo estesi ad alcune altre piattaforme, ma il nostro prodotto BI monitora tradizionalmente lo stack BI in ambiente Microsoft. E quelli sarebbero servizi di analisi per le tue analisi multidimensionali e tabulari, servizi di reportistica, strumento di reporting e quindi servizi di integrazione, che è una piattaforma ETL, simile a Informatica.
E attraverso il nostro prodotto sei in grado di monitorare tutti e tre questi ambienti attraverso un unico prodotto e quello che vedi qui è la dashboard generale, e la cosa da notare qui è quando ne ho parlato in modo allarmante, è una cosa da monitorare, ma non è abbastanza: è necessario disporre di un meccanismo di allerta. In altre parole, devo essere in grado di ricevere una notifica prima che le cose raggiungano uno stato critico. Quindi, quello che facciamo qui, c'è un intero set di metriche che catturiamo che sono configurabili perché a seconda del tuo ambiente, di alcune soglie, potresti stare bene con un tempo di lettura di trenta millisecondi, nel tuo ambiente. Altri ambienti potrebbe essere più critico che tale soglia sia inferiore, quindi è importante non solo avere avvisi, ma averlo configurabile perché gli ambienti sono diversi a seconda delle risorse.
Quindi, in sostanza, questa è una panoramica di tutti gli ambienti che vengono monitorati qui, e qui ho tre casi: uno per i servizi di analisi, uno per i servizi di integrazione, uno per i servizi di reportistica. E vedi che ho un paio di avvisi qui. E poiché questi sono rossi, mi dice che sono fondamentali, perché ho più livelli che posso impostare quegli avvisi e gli avvisi possono essere inviati via e-mail alle persone che sono responsabili di esaminare quale sia il problema. Quindi, solo brevemente daremo un'occhiata e tornerò all'avviso, quindi possiamo andare nel pezzo dei servizi di analisi ed è, sono sicuro che sta aspettando di caricarsi qui. E fondamentalmente, quello che facciamo, abbiamo una raccolta di dati; esce periodicamente, esce e raccoglie e scatta foto di ciò che fanno i tuoi ambienti. Quindi, ho impostato il mio ogni sei minuti, quindi ogni sei minuti esce e fa sondaggi sull'ambiente. Ho dormito la mia VM per un po ', quindi ci vorrà un secondo perché questo ritorni. Eccoci.
Quindi, diamo un'occhiata al pezzo dei servizi di analisi e quindi farò clic sulla mia istanza qui, e ricordiamo che ho parlato di una delle cose che monitoriamo sono le prestazioni a livello di server, perché molte persone hanno più cose in esecuzione sul loro server. Potrei avere un database in esecuzione sul mio server, nonché servizi di analisi, ad esempio. Quindi, se qualcosa sta succedendo nel database o ho un problema a livello di server, avrà un impatto su tutto ciò che sta funzionando lì. Quindi, monitoreremo le cose attraverso il server a livello del server, cose come le prestazioni del disco, e puoi vedere che acquisiamo metriche su tutto questo. E tutto ciò è configurabile. E guardo cosa sta succedendo, dal punto di vista della CPU, solo e ancora, questo è a livello di server, non a livello di servizi di analisi nel mio esempio qui. Ma in realtà a livello di server.
E posso guardare cose come la memoria, l'utilizzo generale della memoria, ad esempio, cosa è disponibile? Quindi ora ho un'idea di quale sia la salute del server stesso. Quindi possiamo iniziare a dare un'occhiata alle cose che sono particolari, in questo caso i servizi di analisi. Posso guardare e vedere come sta andando qui l'elaborazione del mio cubo, e questo mi dà una misura della salute. Se comincio a vedere che l'elaborazione sta impiegando più tempo, o non è che le righe non vengano scritte così rapidamente, allora posso iniziare a dare un'occhiata - e questo va al pezzo di correlazione di cui credo che Robin stesse parlando, è che ci vuole ancora un essere umano per poter fare tutto questo. Parliamo di AI, machine learning, ma ci vuole ancora un essere umano per essere in grado di correlare questi eventi intorno alle cose. Possiamo dare un'occhiata a cose come ciò che sta succedendo per quanto riguarda le query, quali query vengono eseguite e quanto tempo impiegano? Posso ordinare, così posso iniziare a farmi un'idea di quali query impiegano più tempo. Puoi dare un'occhiata qui a tempo trascorso, posso dare un'occhiata e vedere OK, qual era quella query e chi stava eseguendo quella query in quel momento?
Quindi posso iniziare a raccontare una storia fino a quando, quando comincio a vedere le cose iniziare a spuntare, posso tornare indietro e guardare e vedere cosa stavano facendo gli utenti in quel momento. E vedrai una delle cose che facciamo è mettere questo selettore del tempo qui per permetterti di scegliere una finestra temporale. Quindi, ad esempio, posso tornare a quegli avvisi, ed era in realtà un link su quegli avvisi su cui faccio clic e mi ci vorrebbe quel momento nel momento in cui l'avviso si è verificato. E poi posso iniziare a mettere insieme la storia, posso vedere oh, beh, le letture del disco erano attive o avevano problemi di memoria o altro, quindi posso saltare l'attività della query nello stesso momento e posso effettivamente iniziare correlando chi stava eseguendo quali query potrebbero aver causato quei picchi lì dentro. E poi, puoi iniziare a fare cose come io posso iniziare la sintonizzazione, è allora che inizio la sintonizzazione. È come un'auto, se costruisci un'auto da corsa e fai cadere il motore e avvii la chiave che potrebbe avviare il motore, ma se per vincere devo andare a 180 miglia all'ora, devo sapere che il motore può funzionare a 100 miglia all'ora e devo andare lì e iniziare a sintonizzare quel motore per essere in grado di arrivarci. E questo è ciò che ti consente di fare, essere in grado di darti informazioni sufficienti per iniziare a ottimizzare il tuo ambiente, aumentare la salute e la produzione di quell'ambiente e l'efficienza.
E poi, monitoriamo le cose attraverso la memoria che sono particolari per i servizi di analisi, in questo caso. Ed è qui che puoi iniziare a vedere dove le cose potrebbero iniziare ad andare storto, quando inizi a vedere cose che spuntano sopra i tuoi limiti di memoria, cose del genere. L'altra cosa interessante da guardare, ogni volta che esegui qualsiasi tipo di query, vuoi che i dati vengano memorizzati nella cache, perché quando vengono memorizzati nella cache, sono in memoria e non devono leggere dal disco, il che è molto di più efficiente che dover leggere i dati dal disco. Quindi puoi iniziare a dare un'occhiata alle cose che stanno succedendo, mi scusi, per esempio nella cache dei dati. Ho avuto un sacco di query in esecuzione prima, per ottenere questi dati, e puoi vedere che ho avuto la maggior parte del tempo, gli accessi alla cache e le ricerche si sovrappongono, il che è positivo. Ma ho avuto un periodo qui in cui i risultati erano molto più bassi rispetto a quelli delle ricerche, il che mi dice che avevo in corso qualcosa che richiedeva molta memoria, in modo che la cache venisse scaricata molto più velocemente, quindi i dati dovevano essere leggere dal disco. E possiamo vederlo quando osserviamo il motore di archiviazione. Questo è lo stesso punto temporale dell'altro grafico e puoi vedere lo spike lì, dove le query dal file sono davvero aumentate durante quel periodo. Ciò significa che i dati venivano letti dal disco. Ora, posso tornare indietro e quindi correlarlo alle query in esecuzione, e non per far sanguinare le orecchie a tutti, ma nei servizi di analisi utilizza un linguaggio chiamato MDX, ci sono modi per scrivere query in modo più efficiente, quindi utilizza la cache più efficiente e meno spazio di archiviazione. Quindi, c'è un esempio di messa a punto di quel motore e di darti tutti i pezzi necessari per essere in grado di correlarlo.
In breve tempo, possiamo anche capovolgerlo nell'altro modo, quando guardiamo le query, possiamo guardare ora le sessioni, chi è effettivamente connesso a questo punto nel tempo e cosa stanno eseguendo? Quindi questo tipo di ti dà la visione opposta delle domande e di chi le sta eseguendo. Questo è chi è connesso e quindi posso vedere cosa stanno correndo al momento. L'altra cosa, solo per andare rapidamente oltre, è che puoi vedere tutti gli oggetti nei miei cubi MOLAP multidimensionali. E posso ottenere informazioni al riguardo. Quindi, ad esempio, posso ordinare in base a questa colonna di lettura e posso vedere che l'oggetto più utilizzato è la dimensione temporale e il secondo più utilizzato è la dimensione cliente. E questo aiuta le persone che sviluppano e costruiscono cose per costruire i cubi in modo più efficiente. Potrei voler cambiare la mia strategia di partizionamento dei dati, ad esempio, su queste dimensioni molto utilizzate nel mio cubo, e quindi questo aumenterà le prestazioni delle query, per esempio. Potrebbe ridurre le prestazioni dell'elaborazione del cubo, perché ora ho più partizioni, ma dal punto di vista dell'utente ottimizzerà quel motore, per essere più efficiente nell'uso di questi oggetti.
Quindi, vai avanti, parla dei servizi di integrazione qui. I servizi di integrazione, di cui ho parlato, sono una piattaforma ETL in un ambiente Microsoft. Quello che facciamo qui - e questo è coerente - monitoriamo le prestazioni del server, e queste sarebbero le stesse metriche che abbiamo esaminato, perché tutti i miei servizi sono in esecuzione sullo stesso server. Ma ancora una volta, questa è una panoramica di ciò che sta accadendo sul server. E poi posso guardare l'attività per i servizi di integrazione, i miei processi ETL. Quindi, posso avere un'idea di quando questi processi sono stati eseguiti, sia che abbiano avuto successo o meno, posso evidenziare una particolare esecuzione di un processo ETL e quindi mi mostrerà la suddivisione dei passaggi all'interno di quel processo ETL, se ha avuto successo o no e quanto tempo ci è voluto.
Ora, se avessi un pacchetto ETL fallito qui, potrei andare ai dettagli e vedere il messaggio di errore e mi mostrerebbe quale passo in quel pacchetto dove quel processo ETL falliva, insieme a tutti i messaggi associati a quello. Quindi, ciò che fa è che mi dà e posso ricevere un avviso se fallisce, quindi se ricevo un avviso, posso andare qui, vedere, andare a quell'allerta, vedere l'errore del pacchetto, guardare i passaggi, vedi dove è fallito, guarda il messaggio di errore e so immediatamente cosa devo fare per risolverlo: ridistribuirlo e ricominciare da capo. Quindi, ciò che ti consente di fare è chiamarlo accorciando quella finestra tra l'identificazione del problema e la risoluzione del problema. Quindi, nella vita precedente, quando ero responsabile di questo tipo di cose, avevamo un processo ETL che sarebbe stato eseguito di notte, per caricare il nostro data warehouse. Se avessi queste informazioni, per prima cosa al mattino quando sono arrivato, se qualcosa non ha funzionato, allora posso risolverle rapidamente e riavviare quel processo per assicurarmi che il data warehouse fosse attivo e funzionante e aggiornato dal momento in cui gli utenti è arrivato e ha iniziato ad accedere ai rapporti.
L'altra cosa è che ho due processi che corrono, è guardare e vedere come è andato avanti nel tempo. Questo è importante perché se inizio a vedere questi processi, ad esempio, impiegando più tempo, vedendo aumentare questi tempi, allora potrei aver bisogno di dare un'occhiata, ad esempio, alla mia finestra di manutenzione, potrei avere cose che stanno succedendo su quel server . Prendi, ad esempio, i backup; Potrei avere un backup in corso che sta causando il mio processo in attesa fino al termine. Potrei dover riprogrammare o manipolare i miei processi intorno a cose che stanno iniziando a influenzare il mio ETL.
E l'ultimo pezzo riguarda i servizi di segnalazione. I servizi di reportistica sono di Microsoft, fondamentalmente il loro strumento di reporting aziendale. E alcune cose, ancora una volta, possiamo guardare le cose a livello del server, possiamo guardare le cose attraverso il server di report, il server dei servizi di report, stesso. Non ho molte cose che corrono qui; Ho alcuni abbonamenti che passano ogni 15 minuti, per eseguire un rapporto. Quindi, non vedrai molte connessioni attive perché accede, si connette, esegue report, si disconnette e lo invia.
Ma in ambienti transazionali elevati in cui vengono effettuati molti report, è fondamentale essere in grado di monitorare queste cose. Quindi, puoi vedere dove sono andate le cose qui, quindi ti dà una buona idea di cosa sta succedendo, dal livello effettivo di servizio e piattaforma. E poi, come ho parlato nelle diapositive, chi gestisce cosa e cosa stanno facendo? E uno dei nostri clienti ha acquistato questo prodotto solo per questo pezzo perché voleva sapere quali rapporti erano in esecuzione e chi li stava eseguendo. Quindi questa è una delle cose in questa esecuzione del rapporto che puoi vedere qui. Posso vedere quale report, posso vedere tutti i parametri presenti in quel report, posso vedere chi lo sta eseguendo, posso vedere il formato del report. E poi ho tutte queste metriche intorno, quindi, se ancora una volta, posso classificare queste cose, ad esempio, quale rapporto ha impiegato più tempo per recuperare i dati, e posso andare dritto a quello e vedere quale rapporto è. E ancora, tutto questo mi dà dati per essere, per sintonizzare di nuovo quel motore. Ora posso iniziare a ottimizzare il mio ambiente di reportistica.
E l'ultima cosa, posso dare un'occhiata all'attività dell'utente, a cui è di nuovo connesso attualmente, cosa stanno facendo? In realtà, in un ambiente in cui ho avuto più utenti, questi sono tutti ordinabili in modo da poter classificare, posso vedere chi utilizza maggiormente l'ambiente. Quindi, solo per tornare rapidamente indietro e dare un'occhiata a quegli avvisi. Ecco l'allerta; Posso fare clic su questo link qui e mi porterà al grafico per quel momento e mi mostrerà quale era in allerta. Quindi puoi vedere qui, quello è quello perché erano i millisecondi medi per scrivere, ad esempio, leggi e scrivi. Quindi, ancora una volta, sto solo cercando di ottenere quel punto di identificazione dei problemi. Ed è davvero importante avere uno strumento olistico, non solo qualcosa che guardi quell'unica cosa, perché l'essere umano deve entrare qui e correlare questi eventi che stanno accadendo, quindi devi essere in grado di guardare cosa stava succedendo a quello puntare nel tempo attraverso le molteplici aree di quell'ambiente, e questa è una delle cose che facciamo attraverso questo selettore del tempo qui.
Eric Kavanagh: Sì, questo è Eric qui solo con una domanda veloce, perché penso che tu abbia probabilmente colpito l'unghia alla testa, ed è quello di cui stavo parlando all'inizio dell'ora, che un essere umano deve venire e disegnare queste correlazioni tra ambienti diversi. Sono curioso di sapere, c'è del materiale educativo che potete condividere, o forse fate qualche tipo di impegno con la gente per aiutarli a identificare alcuni di questi schemi? Come se avessi fatto un ottimo esempio un minuto fa, riguardo a quando uno di questi sta spuntando, questo ti dice che qualcosa sta succedendo nella memoria perché ha continuato a cercare di scaricare la memoria. E ti dà un indizio, ma come fanno le persone a mappare queste statistiche contro i problemi del mondo reale, è la vera domanda.
Stan Geiger: Sì, questo è un buon punto e una delle cose di cui stavo solo parlando, la road map per il prodotto, è entro la fine dell'anno che rilasceremo una versione e una delle cose che inizieremo ad aggiungere è per ognuno di questi grafici, è una descrizione di ciò che questo grafico significa e perché dovresti preoccuparti, e qual è l'impatto di questo. Quindi essere in grado di fare clic su un punto interrogativo o qualcosa su questo grafico e quindi aprire una finestra che ti darà molte di queste informazioni e dirti che queste sono le possibili cause, queste sono le aree che sono interessate e guidare tu nella direzione di poter andare in questo caso, come hai detto, ecco quel picco, so per esperienza personale cosa significa. E poi posso iniziare ad andare e iniziare a perforare un'area e trovare la causa principale.
Ora ne abbiamo molte, in realtà, nel nostro prodotto di gestione diagnostica per SQL Server, per il database effettivo. Abbiamo un sacco di quel tipo di funzionalità in un prodotto del genere, e abbiamo anche alcuni bulloni di analisi per il responsabile della diagnostica che ti inducono molto più rapidamente. Ed è qui che stiamo andando giù per la strada con questo prodotto.
Eric Kavanagh: E immagino ci siano firme per certi tipi di attività. Questo strumento ti consente di identificare quando si è verificato un determinato tipo di evento e di catalogarlo, in modo tale che nel tempo riconoscerà un modello simile lungo la linea e ti aiuti a capire forse se è un nuovo utente, ad esempio, usando il stesso strumento? Aiutarti a capire, oh, questo perché questi server sono andati in crash o perché questa regione è in calo? Esiste un modo per catalogare le firme dei problemi, in modo tale da poterle facilmente identificare in seguito?
Stan Geiger: No, in realtà, ma in realtà è un concetto interessante, perché è quasi come, cosa è - analisi dei componenti di principio, immagino - dove identifichi schemi e li registri e quindi se li vedi di nuovo puoi tornare indietro e vedi, OK, questa era la causa a quel punto. Sì, è qualcosa, non è sulla road map ma è qualcosa a cui ho pensato dal punto di vista della gestione del prodotto.
Eric Kavanagh: posso immaginare. Oh, vai avanti.
Stan Geiger: No, stavo per dire - e riceviamo molte richieste, perché non so quale sia la tua esperienza - ma ciò che troviamo è che i DBA conoscono i database come il palmo della loro mano, ma la roba BI è un po 'come una scatola nera quando si tratta di salute della piattaforma. E non c'è, non hanno molta base di conoscenza intorno a questo. Lo faccio, solo per averci lavorato per circa cinque o dieci anni, giusto? Ma le persone tipiche che sono responsabili di trovare questi, o ricevere avvisi e capire cosa stava succedendo, è una specie di scatola nera per loro.
Eric Kavanagh: Sì, posso immaginare. Sarei anche curioso di sapere, quindi stavi mostrando in quella schermata come puoi vedere tutte le domande che stanno arrivando, quanto tempo hanno impiegato per essere eseguite e chi le ha generate. Riesci anche a vedere la struttura effettiva della query SQL stessa e il tipo di analisi al riguardo? Come forse a volte le persone mettono insieme query SQL che sono un po 'ingombranti, diciamo, e ingombranti, al contrario di un maestro che mette davvero insieme una query piacevole e stretta. È qualcosa che puoi visualizzare attraverso questo strumento e poi aiutarti a risolvere il problema?
Stan Geiger: Sì, quindi quello che puoi fare è, come quello che ho fatto qui, è che ho appena ordinato per tempo trascorso, ad esempio. Quindi posso vedere quelli che hanno impiegato più tempo e poi ho ricevuto il testo, ma poi tocca ancora a qualcuno che è più o meno l'esperto in materia guardarlo e dire: “Oh, OK, ecco perché ci è voluto così tanto tempo . ”Questo è qualcosa che abbiamo una sorta di analisi del carico di lavoro, lo chiamiamo SQL Workload Analyzer per il lato del database, che ho preso in giro con l'idea di magari lungo la strada inventando qualcosa di simile, in modo che identifichi queste query e quindi fornisce consigli su come ottimizzare tali query. Ma uno dei problemi è che questa query MDX è un linguaggio piuttosto specializzato.
Eric Kavanagh: Sì, posso immaginare. Ma puoi vedere, ad esempio, chi sono le persone, quindi non è troppo difficile capire se una persona, se un ragazzo è responsabile di dieci delle query di processo più lunghe, quindi se nient'altro puoi chiamarlo o chiamare il suo manager o qualcuno e dice: "Ehi, questo ragazzo sta masticando molta larghezza di banda" e forse si scopre che sono le domande più preziose per il business, giusto? Devi metterlo nel contesto di quale sia il valore aziendale, dalle stesse query, non è solo un gioco di numeri chiari, giusto? È da scoprire, beh, questo ragazzo è il nostro power user ed è lui a cambiare business, giusto?
Stan Geiger: No, hai esattamente ragione. Voglio dire, questo è uno dei modi in cui i clienti lo usano, è riuscire a farlo. Come hai detto, potresti trovare un'area, perché una delle cose di cui parlo, scrivo sempre su Excel, ma puoi connetterti ai servizi di analisi in Excel ed eseguire tabelle pivot fuori da OLAP, e genera le sue query e li invia e a volte non sono il modulo migliore, quindi puoi tornare indietro e identificarli e in realtà riscriverli e darli all'utente e lasciarli correre fuori da lì in modo che non impieghino mezz'ora per per tornare alla loro tabella pivot.
Eric Kavanagh: Esatto. E quando parliamo di query, voi ragazzi coprite la gamma di query, quindi avete menzionato MDX, che dire di alcune delle altre query come una query DAX o alcune di queste altre?
Stan Geiger: Sì, copriamo, sì, qualsiasi DAX e MDX entrambi. Quindi una delle cose che non ho menzionato, o forse l'ho fatto, forse, ma supportiamo sia tabulare che OLAP in Microsoft e DAX - penso che tu e io ne abbiamo parlato poco fa - stiamo vedendo molto più tabulare ora di quanto siamo OLAP. Perché è solo più semplice far apparire i modelli tabulari e cose del genere, e quindi vedrai ovviamente le query DAX, ma raccoglieremo anche quelle.
Eric Kavanagh: Sì, è interessante. Hai qualche contesto attorno al perché ciò accada? Forse perché sempre più persone stanno entrando in questa roba e perché OLAP ovviamente non è qualcosa di nuovo, è in circolazione da almeno 30 anni?
Stan Geiger: Giusto, beh, è una specie di combinazione, una delle cose è progettare cubi è un'arte. E i cubi sono stati creati per pre-aggregare i dati, quindi è davvero veloce per ottenere i dati, ma l'elaborazione del cubo richiede un po 'di tempo perché deve fare tutte quelle aggregazioni. E poi, l'hardware è diventato più economico e la memoria è diventata più economica e quindi tutti sono usciti con archivio colonnare e database in memoria, davvero. E anche il tabulare è probabilmente il più vicino ai database relazionali tradizionali ed è solo molto più facile e veloce far apparire i modelli tabulari rispetto a OLAP. Ma lo svantaggio è che risiede nella memoria, il tutto risiede nella memoria, quindi è molto intensivo e i dati non si aggregano fino a quando non viene richiesto. Quindi, ma detto tutto ciò, stiamo iniziando a vedere molto più tabulare là fuori.
Eric Kavanagh: È interessante. Potrebbe anche essere perché questo settore si sta un po 'appiattendo, e ciò che intendo è che stiamo ottenendo molte più persone che interagiscono con i dati e utilizzano vari strumenti, e certamente quando parli di Microsoft, penso questo è sicuramente il caso in cui hai molti, molti più utenti per le piccole e medie imprese e persino alcune organizzazioni più grandi che stanno scavando nelle cose, ottengono l'accesso agli strumenti, eseguono query e forse non hanno familiarità con il l'intero processo e le tecnologie attorno alla costruzione di cubi, a tuo avviso, giusto? Perché ci vuole un po 'di pensiero ed è anche costoso, giusto? Ci vuole tempo, ci vuole energia per costruire questi cubi a meno che tu non stia usando alcune delle più recenti tecnologie là fuori. Ad esempio, abbiamo parlato con aziende come Snowflake, ad esempio, sta facendo cose piuttosto interessanti, ma penso che tu abbia molte più persone che usano le cose e probabilmente andranno con quello che hai appena descritto, che è il formato tabulare, al contrario di costruire formalmente cubi, giusto?
Stan Geiger: Sì, beh, voglio dire, suppongo che Excel - quando era, Power Pivot, credo - questo è in realtà tabellare, se lo guardi; è il modo in cui costruisci modelli tabulari. E poi la prossima iterazione è stata, posso dirti i miei modelli tabulari che ho creato e lo distribuisco su SQL Server in modo da poterlo condividere con tutti gli altri. Quindi, è quasi un'estensione naturale di Excel.
Eric Kavanagh: Sì, è un buon punto. Quello che abbiamo visto negli ultimi, direi da cinque a sette anni, è solo un'enorme espansione dell'uso di queste tecnologie, giusto? E Microsoft, francamente, è stato un pioniere in questo, democratizzando davvero i dati di potenza attraverso i servizi di analisi e tramite Power Pivot, giusto? Voglio dire, è stato un punto di svolta per l'industria, giusto?
Stan Geiger: Sì, no, hai esattamente ragione. Voglio dire, ho una diapositiva quando faccio una presentazione più lunga che mostra la transizione dal modello semantico, che era l'OLAP, al tabulare. E penso di avere una citazione da Microsoft; vogliono dati nelle mani degli utenti, non solo oltre il muro nel negozio IT, vogliono ottenere più dati nelle mani delle persone che li stanno consumando.
Eric Kavanagh: E questo torna subito a quella prima semplice diapositiva che ho mostrato, che era il processo decisionale di base per qualsiasi organizzazione, e ora - e penso che sia una cosa grandiosa - stiamo ottenendo sempre più persone dall'intera gerarchia dell'organizzazione prestando attenzione a ciò che sta accadendo, portando la loro storia al tavolo e lo fai con i dati, questa è la linea di fondo, intendo, puoi usare altri mezzi, ma se esegui il backup della tua storia con i dati, avrai argomenti molto più forti di quelli che non lo fanno, giusto?
Stan Geiger: Esatto, sì. Sì, è esatto. Voglio dire, ecco perché adesso era "Ehi, ho bisogno di questo rapporto", quindi ora devo passare attraverso la richiesta di rapporto e devo passare da qui, per ottenere il mio rapporto, e ora posso sedermi proprio lì alla mia scrivania e davvero, ho accesso ai dati generati, prendo le mie decisioni aziendali.
Eric Kavanagh: Esatto. Sai, sono tornato da una conferenza proprio la scorsa settimana e c'era un commento isterico da un ragazzo che gestisce un ambiente di BI piuttosto grande per il negozio Target, e si riferiva a analisi self-service e BI self-service, e ovviamente questo è un grosso problema in questi giorni. Sono sicuro che è qualcosa che sta guidando molte attività per quello che voi ragazzi fate in IDERA perché quando volete implementare il self-service, prima di tutto è meglio avere un ambiente di BI sano, giusto? Se hai intenzione di convincere tutti i tipi di persone che fanno ogni tipo di domanda in tutti i modi, vorrai avere qualcosa come questo strumento proprio qui, per essere in grado di capire chi sta ponendo quali domande e dove. E la citazione divertente che lancerò solo per i calci qui, come hai detto, "C'è una linea sottile tra la self-service BI e vai F da solo."
Stan Geiger: Sì.
Eric Kavanagh: pensavo fosse isterico. Ma stai vedendo che la tendenza self-service porta davvero molta consapevolezza su ciò che stai facendo con la tecnologia?
Stan Geiger: Sì, perché come hai detto, se hai intenzione di consentire la BI self-service, probabilmente avrai problemi di prestazioni, a causa del solo: A) la quantità di accesso, la quantità di persone che vanno ai dati, e B) la quantità di query scarsamente formate e le modalità per accedervi che hai. Quindi, davvero, è davvero indispensabile monitorare l'ambiente in modo da essere in grado di soddisfare tutti coloro che stanno cercando di consumare i dati, giusto?
Eric Kavanagh: Sì, penso sia esattamente giusto. È una benedizione e una maledizione: è bello che le persone stiano cercando di usare le cose, ma ancora una volta, al tuo punto, se non hai lo strumento giusto al momento, diventerai un camper infelice perché rotolare self-service senza uno strumento come questo, mi sembra che stia solo chiedendo una montagna di problemi.
Stan Geiger: Sì, voglio dire, è simile a quando stavo costruendo data warehouse, è come se non avessi le dimensioni e le tabelle dei fatti corrette, quindi le avessi sciolte per i rapporti ad hoc, potresti voler eseguire la scansione sotto un roccia.
Eric Kavanagh: Fantastico. Sì, è una buona notizia, ancora una volta, è una buona notizia che le persone stiano usando queste cose, ma penso di dover credere che il self-service guiderà molte attività per quello che stai facendo, perché stai parlando di dilagare la quantità di tensione e la pressione su questi sistemi per ordini di grandezza. Non solo per uno, o per due ordini di grandezza ed è quel punto che vuoi davvero avere un po 'di visibilità e vuoi essere in grado di vedere chi sta facendo cosa, dove, quando, come e perché. Poni queste domande e prendi alcune decisioni su come monitorare e cambiare l'ambiente e cambiare le tue politiche su chi ha accesso a cosa, giusto?
Stan Geiger: Giusto. E sai, anche, sapendo, vedendo che l'utilizzo ti consente anche di entrare lì, e il potenziale, come ho detto l'oggetto nel cubo, posso fare cose per migliorarlo, che per quanto riguarda il modo in cui costruisco e progetto cose. Quindi, è imperativo che non solo quello di guardare le prestazioni delle cose, ma anche di poter vedere come il tuo schema e il tuo design stiano funzionando anche a quel livello, al fine di essere in grado di modificarlo. E diventerà sempre più grande dato che cose come Power BI sono il grosso problema ora, con Microsoft, quindi ora posso costruire i miei dashboard e widget e cose, e non devo essere uno sviluppatore BI.
Eric Kavanagh: Esatto. Sì, è roba buona, arriva ovunque, ma avrai bisogno di un modo per gestire quell'ambiente o otterrai utenti infelici. Ciò porta a una gestione infelice, che porta alle persone a essere licenziate. C'è un effetto domino abbastanza chiaro quando le cose iniziano a cadere, ma questa è roba fantastica.
Quindi ho masticato gli ultimi cinque minuti qui. Robin, hai qualche domanda?
Robin Bloor: Beh, penso che sia davvero affascinante, a dire il vero. Mi fa pensare al fatto che abbiamo avuto ambienti molto limitati e il self-service sta davvero cambiando il mondo e molte cose stanno accadendo davvero perché sono stati immessi nell'ambiente moltissimi dati di quanti ne siano accaduti prima. L'unica domanda, perché non abbiamo molto tempo, ma l'unica domanda a cui sarei interessato a porre è come stavi spiegando il modo in cui - perché pensavo fosse una demo molto buona - il modo in cui il Il monitoraggio della BI funziona. Mi chiedevo cosa fanno realmente le persone che non hanno questo tipo di cose? Poiché deve essere molto difficile, ci sono un certo numero di cose in cui fai la differenza, la causa principale va bene, non devi sempre arrivare alla causa principale, ma puoi arrivare alla causa principale con alcune cose che stai osservando, che quando hai detto che un certo numero di persone compra lo strumento solo per sapere chi gestisce cosa, e che la mia mente gira, perché è come se non sapessi chi gestisce cosa, quindi le cose sono fuori controllo. Quindi, che aspetto ha l'ambiente quando è fuori controllo?
Stan Geiger: Voglio dire, potresti ottenere tutte queste informazioni che abbiamo nello strumento tu stesso, ma dovresti scrivere un sacco di script nazionali e perché i dati sono tutti là fuori è solo che devi sapere dove capito, che richiede un livello di competenza, giusto? Quindi, in ambienti in cui non hai quel livello di competenza, in sostanza, quello che ottieni è, ehi, è su o giù? Davvero non so se funziona in modo efficiente o no, ma va bene, giusto? E poi comincio a ricevere telefonate o persone che rispondono: "Ehi, il mio rapporto non è nella mia casella di posta, cosa sta succedendo?" O "Ho appena inviato questo rapporto tramite servizi di segnalazione" o potrebbero fare una query qui nei servizi di analisi, ma è durata circa mezz'ora e impiegava solo 30 secondi, cosa sta succedendo? Bene, ora devi fare l'esercitazione antincendio e provare a capirlo, e senza uno strumento diventa molto difficile.
Robin Bloor: Beh, giusto, quella era la cosa che stava diventando sempre più evidente per me, mentre dimostravi ciascuna delle dimensioni di ciò che effettivamente hai qui. L'altra cosa, è come a un livello molto, molto primitivo, se non hai avvisi che ti dicono che le cose vanno male, allora è solo un costoso - ti trovi in una situazione costosa, provando a curare ciò che è successo, perché tu non scoprirlo fino a quando le cose non iniziano a cadere male, giusto?
Stan Geiger: Giusto, non sai cosa non sai.
Eric Kavanagh: ce l' hai. Bene, ehi gente, abbiamo passato un'ora e ci siamo cambiati, qui. Un grande grazie al nostro Robin Bloor e, naturalmente, al nostro amico, Stan Geiger, di IDERA Software. Saranno presenti all'Enterprise Data World, infatti, se qualcuno di voi andrà laggiù, anche il vostro sarà davvero lì ad Atlanta. Il nostro buon amico, Tony Shaw, sta facendo un ottimo lavoro gestendo quella conferenza da quattro anni ormai, e hey, ciò che è vecchio è nuovo di nuovo. È tutto roba calda. Speriamo di vederti là fuori, in caso contrario, ricontrollare con noi la prossima settimana, abbiamo un sacco di altri webcast in fila.
Sempre curioso di ascoltare i tuoi pensieri, inviare un'e-mail a, che va bene per me, se hai domande o suggerimenti o altre tecnologie che vorresti conoscere in Hot Technologies. E con quello, ti saluterai, gente. Grazie ancora per esserti unito a noi, ti parleremo la prossima volta. Stai attento. Ciao ciao.