Di Techopedia Staff, 11 maggio 2016
Takeaway: l' host Rebecca Jozwiak discute i progressi nell'architettura e nell'archiviazione del database con Dez Blanchfield, Robin Bloor e Brian Bulkowski.
Al momento non sei collegato. Accedi o registrati per vedere il video.
Rebecca Jozwiak: Signore e signori, ciao e benvenuti a Hot Technologies del 2016. Oggi siamo "Esporre la differenziazione: arriva una nuova era di infrastrutture scalabili". Oggi sto intervenendo per Eric Kavanagh. Sono Rebecca Jozwiak, la tua umile schiera del consiglio di amministrazione mentre Eric è fuori in Giamaica. Buon per lui.
Quindi, come è stato per decenni, quest'anno è caldo, anche se probabilmente la tecnologia si sta muovendo a un ritmo che supera la legge di Moore e cosa stanno facendo le organizzazioni per tenere il passo? Stanno cercando tutto ciò che è veloce e la scala, direi, è probabilmente una delle cose più importanti quando pensiamo ai database. E ovviamente abbiamo le opzioni per la solita relazione, ora abbiamo il nostro NoSQL, abbiamo il nostro archivio di colonne, abbiamo i nostri database di grafici, i nostri database RDF, ma in realtà, ciò che le aziende cercano è la scala, il parallelismo ed è veloce .
Ora, le architetture tradizionali erano in qualche modo basate su quel modello relazionale. Ma se guardi alla maggior parte delle attività web che sono sorte negli ultimi tre, cinque, dieci anni, non sono i modelli che usano per la loro infrastruttura. Stanno usando un'architettura diversa, parallela, si stanno ridimensionando e sono veloci, ed è un po 'quello a cui molte persone si rivolgono oggi.
La nostra formazione, abbiamo Dez Blanchfield, è uno scienziato del Bloor Group. Abbiamo il dottor Robin Bloor, il nostro principale analista del Bloor Group, e abbiamo Brian Bulkowski, CTO e fondatore di Aerospike. Quindi ragazzi con quello, lo consegnerò a Dez.
Dez Blanchfield: Grazie e grazie per avermi qui. Proverò a impostare la scena di come siamo arrivati molto rapidamente a dove siamo e ci immergeremo in molti più dettagli tecnici mentre affrontiamo gli argomenti di oggi. Vado a prendere il controllo dello schermo qui.
Così più grande, migliore e più veloce. Quando penso a dove siamo, l'immagine che mi viene in mente personalmente, è proprio questa immagine che ho sulla diapositiva del titolo, che è l'espansione dell'universo. La tecnologia si sviluppa e cresce da decenni ormai, in effetti dalla fine degli anni Cinquanta, quando il mainframe divenne una realtà. La tecnologia ha continuato a crescere in molti casi a una curva peggiore o maggiore di una curva lineare, a seconda della parte della curva in cui ti trovi, per quanto riguarda il software o l'hardware.
La scala è diventata sempre più grande, e sempre più veloce, per quanto riguarda ciò che stiamo cercando di fornire, e sempre più piccoli a livello di produzione e semiconduttori. E nel mezzo c'è il software e le applicazioni e i sistemi che sono alla base di quel software, e tendono a diventare sempre più piccoli in natura, e abbiamo visto cose come applicazioni containerizzate e micro server, è diventato di nuovo una cosa. Lo abbiamo fatto in passato, decenni prima, ma come risultato di diventare sempre più piccoli lì, stiamo diventando sempre più grandi nella scala di cui ora possiamo eseguire cose, come applicazioni e database particolari, e la logica di quei database.
Ho questa visione in cui abbiamo ridimensionato molto orizzontalmente, essenzialmente nell'asse X; abbiamo ridimensionato verticalmente nell'asse Y. Ora siamo al punto in cui dobbiamo andare in un posto diverso, e nella mia mente quello è un po 'come immaginato mentalmente come un asse Z, e cioè che dobbiamo approfondire la tecnologia e vedere come possiamo fare le cose diversamente da quello che abbiamo fatto finora, per ottenere quel pezzo di velocità aggiuntivo. Quindi visualizzo l'intera espansione dell'universo, dove abbiamo avuto luogo un'esplosione, esistono alcune tecnologie e questa migliore crescita e domanda lineare. Abbiamo dovuto trovare modi diversi per ottenere quel risultato più grande, migliore e più veloce.
Giusto per coprire rapidamente un po 'dove siamo ora in un paio di ambienti hardware. Abbiamo visto i costi in calo di un gigabyte di spazio su disco determinare un paio di transizioni e tecnologie abbastanza grandi e approcci al problema della scala più grande, migliore e più veloce. Questi sono due grafici separati che coprono circa un decennio ciascuno, poco più di un decennio ciascuno del prezzo in calo di un gigabyte di spazio su disco.
È una classica curva a J o una mazza da hockey come spesso ci riferiamo a loro, in quanto qualche tempo fa potresti spendere letteralmente centinaia di migliaia di dollari per acquistare un gigabyte di spazio su disco, non proprio due decenni fa, mentre oggi è diventato dollari e alla fine sono sicuro che finirà, ciò che chiamiamo la corsa a zero, diventerà centesimi. Ciò ha comportato un cambiamento interessante nel tipo di cose che le aziende potrebbero fare. E mi riferisco a ciò come un'interruzione dei dati o dei big data in particolare, e con ciò intendo che abbiamo visto le tecnologie, come il modo di diventare una cosa in cui potremmo ridimensionare orizzontalmente nello storage e il tipo di calcolo che abbiamo può applicarsi a tale spazio di archiviazione e al modo in cui apre una tecnologia interessante perché ci consente di eseguire archivi paralleli ridondanti di grandi dimensioni al livello più veloce e le parti di Hadoop in sé, essendo nativamente in grado di copiare i dati in una scrittura una volta letti più volte e ridimensiona la cosa a un livello quasi lineare.
Ed è tutte le aziende come questa che si realizzano per interrompere l'utilizzo dei big data. Abbiamo compagnie come Uber che sono la più grande compagnia di taxi al mondo. In realtà non possiedono alcun taxi, ed è una lunga lista qui. Airbnb è il più grande fornitore di alloggi, in realtà non ha proprietà immobiliari. Uno dei miei preferiti è Facebook, ad esempio in questo elenco, dove in realtà non creano i contenuti, li creiamo per loro, ma in realtà sono i più grandi proprietari di media del pianeta. Ne abbiamo di interessanti come le banche in più rapida crescita, in realtà non abbiamo soldi. Queste sono piattaforme e banche di prestito peer-to-peer, e ce n'è una in Australia, in particolare, che sta crescendo fama qui chiamata SocietyOne. E alcune delle principali banche che devono disporre di liquidità stanno investendo in quella particolare banca peer-to-peer. E passiamo attraverso questo elenco fino a Netflix; in realtà non possiedono alcun cinema e tuttavia sono effettivamente la più grande sala cinematografica del pianeta.
Quindi sono arrivati a dove erano, nella mia mente, attraverso l'applicazione di tecnologie intelligenti a livello di dati, perché potevamo fare spazio di archiviazione più grande e più ampio a costi inferiori a causa del calo del prezzo di un gigabyte di spazio su disco rigido e potevamo applicare un calcolo intelligente e distribuire un modello di calcolo su quello. Queste aziende hanno avuto la capacità di creare un vantaggio competitivo e interrompersi a causa della caduta dei costi dello spazio su disco.
Abbiamo visto accadere una cosa simile nel costo della memoria. Un paio di decenni fa, se avessi sei milioni di dollari in giro, potresti acquistare un gigabyte di RAM, e abbiamo avuto una curva J o un bastone da hockey molto simili, si svolgono nella riduzione dei costi o del prezzo diminuito di RAM. E questo ha portato ad alcune cose interessanti, e nella mia mente, una delle maggiori interruzioni in quello spazio è la quantità di memoria che può essere incorporata in dispositivi, come dispositivi mobili, come telefoni e tablet e persino laptop. Computer al giorno d'oggi, la quantità di memoria che va in un laptop medio è abbastanza ridicola in alcuni casi. In alcuni casi, il mio laptop attuale ha più memoria di alcuni dei server che utilizzavano non molto tempo fa.
Ciò ha comportato cambiamenti significativi di per sé, in un modo simile a quello che ha in mente una RAM, ci ha permesso di ridimensionare e ridimensionare rapidamente. E ora abbiamo avuto la nascita di una tecnologia che chiamiamo flash, e questa è una tecnologia che originariamente deriva da qualcosa che si trovava su hardware sotto forma di EEPROM, un piccolo chip progettato per essere disponibile, e scrivere a, e quindi proprio quando si spegne, manterrà qualsiasi cosa tu abbia scritto su quel chip come memoria persistente. Era lento, era goffo e in quei giorni, penso che sia stato verso il 1980-1981 che in un certo senso è diventato una cosa. Nel 1984, Toshiba, che credo abbia inventato la tecnologia, l'ha resa una cosa commerciale che potremmo usare.
Ma in poco tempo, le persone hanno capito che potevano effettivamente prendere una combinazione dei componenti che sono stati usati per creare questo concetto di EEPROM, una memoria di sola lettura, una volta che è stata cancellata e scritta su di essa, e potevano effettivamente scriverci su base regolare e usalo un po 'più come spazio su disco e un po' più come RAM. Nel tempo, si è sviluppato. Ora questa tecnologia di archiviazione flash è stata una fusione tra l'archiviazione su disco tradizionale, che si tratti di un disco rotante o in alcuni casi di un disco ibrido di memoria e RAM. E la cosa fondamentale è il sistema in mezzo perché puoi leggere e scrivere su di esso, quindi spegnere l'alimentazione e manterrà ciò che hai scritto. Quindi uno spazio su disco, ovviamente ci scrivi, spegni l'alimentazione, e il mandrino che gira e il pesantemente modificato, per mancanza di una descrizione migliore, mantiene gli zeri e quelli che hai scritto su di esso.
Nello spazio di memoria ad accesso casuale, scrivi qualcosa nella memoria nella RAM, spegni il computer e tutto viene cancellato perché non ci sono più elettroni per tenerlo carico e conservare le informazioni che gli hai scritto. Inoltre è nel mezzo ed è estremamente veloce, più veloce del disco, un po 'più lento della RAM. Ma puoi scrivergli, e leggere da esso, e quando spegnerai l'alimentazione, persisterà. Ciò ha portato ad alcune tecnologie straordinarie e in particolare abbiamo sviluppato dispositivi mobili e laptop che sono davvero, molto veloci e in grado di fare molte cose, e ora è spostato nello spazio dell'infrastruttura attorno allo storage e al calcolo, e questo ha portato a risultati significativi cambiamenti in ciò che possiamo offrire su larga scala. Questo è un po 'dove credo che l'asse Z nella mia mente stia nascendo ora.
È quasi giusto in tempo in molti modi, perché ora abbiamo visto un'interruzione attraverso ciò che io chiamo domanda, e cioè che i consumatori hanno, indipendentemente da ciò che sta accadendo nell'infrastruttura e nello spazio tecnologico, e dalla capacità di guidare più velocemente e un calcolo più rapido e prestazioni a livello di infrastruttura, i consumatori chiedono questa interruzione sotto forma di ciò che viene ora chiamato, l'esperienza delle celebrità. Tutti vogliono che ogni sistema, ogni app, ogni sito Web sappia chi sono e cosa amano e per poter offrire loro un'esperienza individuale personalizzata. Non è più abbastanza buono solo per andare su un sito web dove compro i biglietti del cinema. Voglio che sappia cosa ho comprato prima, perché l'ho comprato e potenzialmente ciò che le persone come me hanno comprato e consigliano le cose.
Invariabilmente, stiamo vedendo ciò a cui mi riferisco è un ordine collaterale di social, ed è che voglio l'esperienza delle celebrità, ma voglio anche socializzare quell'idea, voglio condividerla con tutti i miei amici e dire loro quello che lo sto facendo e voglio anche sapere cosa stanno facendo i miei amici. E questo è il risultato di una domanda esplosiva di elaborazione e archiviazione aggiuntiva e di una rapida inversione di tendenza. Abbiamo visto la generazione Fitbit, quello che chiamo monitoraggio sempre attivo. Tutto ciò che faccio viene monitorato, registrato e catturato da qualche parte. Abbiamo visto tutto in tempo reale: operazioni bancarie, offerte, motori di raccomandazione, dovendo essere in grado di far fronte a cose in tempo reale che sto facendo personalmente come consumatore.
E poi vediamo un impatto molto grande, come i rischi per la sicurezza legati alla sicurezza informatica. In passato avevamo singoli hacker, poi ci si applicavano bande criminali, ora abbiamo intere nazioni che vanno in guerra su Internet, il che è una cosa reale e in realtà accade. Presta attenzione a questo, siediti e guardalo, perché c'è un impatto reale su questo, e alcuni dei nostri scherzi pre-show erano in giro a discutere del rischio di far penetrare il tuo computer, o almeno la tua rete.
Abbiamo visto questo concetto di estrazione di entità. L'estrazione di entità è quando dobbiamo trovare cose di interesse all'interno di insiemi di dati molto grandi e in particolare intorno a frodi, attività illegali e di tipo hacker. Ma il più delle volte, vedremo che l'estrazione di entità sta diventando un punto focale per cose buone e cose che per noi sono di valore, invece di cercare cose che ci stanno attaccando.
Abbiamo anche visto un'esplosione, i cosiddetti dati geospaziali. Si tratta di dati che sanno effettivamente da dove provengono o da dove provengono altri dati simili. Puoi immaginare di essere in piedi nella strada e vuoi trovare la stazione di parcheggio più vicina, o il ristorante più vicino, applicazioni che possono applicare calcoli e dati geospaziali, elaborazione di dati che sanno dove si trova nello spazio, è molto importante perché devi essere in grado di sapere dove sono altri oggetti ed entità e farlo rapidamente.
Abbiamo visto dispositivi mobili connessi in modo permanente. Anche quando andiamo a dormire la notte, i nostri cellulari continuano a ticchettare, aggiornando le nostre e-mail, controllando i nostri calendari, osservando che tempo fa e capendo se ciò che vorremmo per colazione sarà disponibile. C'è molto rumore che sta accadendo lì, e questo ha creato un impatto enorme su ciò che dobbiamo fare sul back-end e sulla velocità con cui lo facciamo.
Nel complesso, la vastità e l'impatto di ciò che viene definito come l'Internet of Things, o più spesso, la connettività da macchina a macchina, in cui i dispositivi parlano ai dispositivi e che arriva fino ai motori collegati al lato degli aeroplani che dice all'aereo stesso, o al sistema di gestione dell'aeroplano, che un cuscinetto sul motore numero quattro sta vivendo un'eccessiva usura e calore, e dovrebbe essere sostituito quando atterriamo, e quindi comunica ad un'altra macchina, e quindi dovrebbe posizionare un ordine, e magicamente un ingegnere appare in volo all'aeroporto ed è pronto a sostituirlo durante il rifornimento.
E la scala che è così grande e così grande che abbiamo dovuto approfondire ciò a cui mi riferisco, tramite l'accesso al tipo di fronte. Perché un nuovo mondo, e benvenuto nel nuovo mondo, un nuovo mondo di tutto ciò che usiamo per essere connessi; una volta erano satelliti e dispositivi di rete, ora sono dispositivi mobili e i nostri laptop e tablet e telefoni, e persino la mia nuova Audi ha un cartello incorporato e riporta costantemente sulla propria salute, ma si aggiorna anche, e sa dove si trova e quali mappe sono applicabili e mi dice persino quando percorrere un percorso diverso se c'è traffico sulla strada da percorrere.
Tutto ciò che stiamo costruendo ora, tutto ciò che ti stiamo parlando ora, è stato progettato per connettersi e connettersi ad altre cose, non solo da me a sistema, ma da sistema a sistema, e per essere in grado di farcela devi applicare idee molto diverse a livello di infrastruttura, sia a livello di hardware che di software, e in particolare ai livelli di database di cui i sistemi hanno bisogno per sostenere questo, e in molti modi il database è diventato il motore e le app sono davvero solo piccoli robot che fanno le cose.
Ho intenzione di concludere rapidamente qui con questa visione un po 'umoristica sul tipo di dove stiamo andando con queste cose, e quello che chiamo "IoT con la semplice pressione di un pulsante". C'è stato un nuovo gadget creato chiamato il Amazon Dash Button, e questo è un piccolo gadget delle dimensioni di un pollice. In effetti in molti modi, è lo stesso della mia chiavetta USB. Quando acquisti questa cosa, ci sono circa $ 4, 99 US online da Amazon, ti viene spedito, lo configuri con il tuo cellulare e lo colleghi letteralmente a uno dei tuoi dispositivi, come un frigorifero o una lavatrice o altro. Nell'esempio della tua lavatrice, se alla fine esaurisci il detersivo, puoi premere quel pulsante e comporrà il numero a casa e ordinerà automaticamente di più per te, e magicamente più ti verrà spedito tramite i nostri buoni amici su Amazon.
Per me, questo mi spaventa, perché vedrà un'esplosione di una serie di cose connesse alla rete e che tentano di creare connettività e generare domanda. Se puoi immaginare, una o due di queste cose forse non sono così spaventose, ma l'ultima volta che ho guardato, c'erano oltre 110 di queste cose marchiate, quindi quasi ogni marchio sul pianeta proverà a ottenere la loro piccola spinta- pulsante IoT, che torni a casa e premi un pulsante e dice "Ordina una pizza". Premi un altro pulsante e ordina un pranzo pre-costruito per i tuoi figli a scuola domani.
Ciò sta guidando una così grande richiesta di trasformazione nel back-end, a livello di applicazione, in particolare a livello di database, che penso che abbiamo appena visto la punta dell'iceberg del tipo di trasformazione delle prestazioni che dobbiamo vedere . E con ciò, lo consegnerò al dottor Robin Bloor e fornirò anche le sue intuizioni su dove siamo.
Rebecca Jozwiak: Okay Robin, ti ho passato la palla.
Robin Bloor: Non va bene? Ok, eccoci, sono io. Ho visto la presentazione di Dez prima di venire a questo, quindi direi cose complementari piuttosto che ripetere alcune delle cose che Dez ha detto. Ho pensato di parlare dell'evoluzione del database in termini di ciò che è effettivamente accaduto all'architettura, e così via e così via, di database da una prospettiva storica.
Il problema fondamentale di qualsiasi fornitore di database è il mantenimento di un'architettura flessibile che ridimensiona e tenga il passo con l'evoluzione dell'hardware. Ne parlerò, ma quando guardi indietro e vedi il modo in cui i database erano soliti costruire e il modo in cui sono stati costruiti ora, sono in realtà significativamente diversi da quello che definirei il livello di progettazione architettonica . Vale la pena solo rivedere il perché, o almeno penso che lo sia. I fattori hardware e Dez ci ha fornito una carrellata particolarmente buona degli strati inferiori in termini di memoria e disco. Quello che abbiamo ora, e questo è il futuro, Intel è il prossimo, CP che avrà un FPGA su di esso. Quello che la gente farà con quello, non ne ho idea. AMD sta unendo CPU e GPU e che differenza farà? Questi sono i tipi di modifiche che faranno davvero la differenza nel database, e sospetto che Aerospike tra gli altri, poiché Aerospike è guidato dalle prestazioni, probabilmente lo sta già osservando e sta studiando dove pensa che andrà effettivamente con il modo in cui funziona il prodotto.
Abbiamo un sistema su un chip che non è ancora decollato. Gli SSD che conosciamo, ma il punto da sottolineare è che stanno effettivamente aumentando di velocità, all'incirca il tasso della legge di Moore, un fattore di 10 ogni sei anni. Ma Intel sta per rilasciare il punto di attraversamento 3D, che afferma di essere in grado di andare più di cento volte più veloce degli SSD, in effetti, una sorta di calo nel mix, quindi questo cambierà la velocità con cui prodotti come Aerospike possono effettivamente partire.
Poi abbiamo le architetture hardware parallele, in altre parole il modo in cui abbiamo costruito l'hardware nel senso di - in origine era solo una CPU che si trova sulla memoria, che si trovava sul disco, ma è diventato molto più complicato di così. L'idea di un sistema su un chip è che si può effettivamente avere un parallelismo chip-to-chip-chip e far andare tutto a una velocità straordinaria, e non abbiamo idea di quale di questi prodotti dominerà realmente.
Questo è solo uno sguardo al futuro, ma a livello di hardware le prestazioni stanno accelerando e i costi continuano a scendere, seguendo le linee che Dez stava descrivendo. Le tue CPU non diventano necessariamente più economiche, ma diventano più veloci e così via.
Dal punto di vista aziendale, in alcune situazioni, e queste sono situazioni di mercato, il primo è il valore aziendale. Se in particolare - se sei assolutamente convinto che un determinato titolo scenderà di prezzo, la prima persona che ottiene l'ordine di vendita ottiene il prezzo migliore. È davvero così semplice. Pertanto, c'è una corsa tecnologica che prosegue nel trading automatizzato nelle banche per cercare effettivamente di vincere queste situazioni. Che cosa è successo dopo? Cosa succede dopo che le banche hanno fatto il loro dovere con tutto ciò? Stai improvvisamente iniziando a vedere altre aree infettate dallo stesso tipo di esigenze di velocità.
In realtà ciò che stava accadendo è che gli esseri umani sono stati rimossi dall'equazione, e questo è successo molto rapidamente con la pubblicità su Internet. Ma il fatto era che non si trattava di una transazione specifica, dell'esecuzione di metodi, questo è un intero processo aziendale, è il fatto che una pagina Web è stata appena eliminata e deve essere presa una decisione che può essere una decisione abbastanza complicata, su quale annuncio pubblicizzare effettivamente su quella pagina web, deducendo da chiunque l'utente del browser sia quello che sarebbe l'annuncio più appropriato per inserirlo, e così via e così via. È diventata una cosa molto complessa, e lo citerò di nuovo.
Ma il punto è che le prestazioni e la scalabilità dei processi aziendali, non sono lo stesso problema delle prestazioni e della scalabilità di una capacità di query, e questo è qualcosa che sono ben consapevole, a causa di un recente briefing room che abbiamo fatto con Aerospike che loro sei anche a conoscenza di. Un'altra cosa, quando stai effettivamente lavorando a queste velocità, le proprietà degli asset sono importanti per una transazione, qualsiasi elaborazione di eventi. Sono davvero importanti. Quindi, moltissimo di ciò che stanno facendo alcuni database, che sta perdendo una o due lettere dalla risorsa, potrebbe funzionare abbastanza bene nel contesto - questo funzionerà bene nel contesto di cui stiamo parlando. Non è davvero accettabile, a dire il vero.
Dal punto di vista tecnologico, in realtà stai guardando: so che ci sono due tipi di leva finanziaria, al fine di creare il tipo di architetture che sono effettivamente richieste per fornire il tipo di velocità che può fare, come Aerospike, può fare un milione di transazioni al secondo. Devi essere davvero molto preciso in termini di sviluppo del software. Non puoi semplicemente hackerare. Devi preoccuparti della lunghezza del percorso del codice. Devi fare un uso eccellente della memoria e in realtà stai ottimizzando intere transazioni. È necessario un parallelismo intelligente e anche un parallelismo a prova di errore. È necessario ridimensionare, anziché ridimensionare, poiché non appena si coinvolge la rete in qualcosa, diventa il puntatore più probabile che si raggiungerà la latenza e inizierà a rendere le transazioni troppo lente.
Devi ottenere il più possibile su qualsiasi dato noto di una rete prima di ridimensionare effettivamente e davvero non vuoi ridimensionare rapidamente, davvero non vuoi molti processi. Vuoi una rete che non sia utilizzata da nessun altro. E vuoi avere una rete incredibilmente veloce.
Lo storage SSD accelerato è qualcosa - in realtà penso che la maggior parte di ciò si applichi a ciò che fa Aerospike. Una delle cose interessanti è che è un database NoSQL. Si credeva - non lo so, un certo numero di anni fa - si credeva che il database relazionale fosse l'unico database e dominasse tutto, ed era solo questa strana piccola nicchia in cui non era necessario diventare relazionali. È un po 'rovesciato ora. Sono i database veloci che si trovano su quei database SQL e uno dei motivi per questo, il motivo principale di ciò, è che evitano di unire i dati, archiviano i dati praticamente in modo oggetto. Quando hai finito con un oggetto, lo memorizzi e poi torni indietro l'intero oggetto, non unendo le cose per elaborarle. Questa è la velocità. Questo tipo di tecniche che generano velocità nel contesto del database.
Questa è la scia di lacrime, questa è la, cosa è successo al database. La storia o la narrazione dei database relazionali era la fine di un database in realtà non era vero. Anche quando hanno iniziato a dominare, era ancora necessario. I database degli oggetti effettuavano le transazioni passate in quei giorni, perché i database relazionali in realtà non potevano eseguirli, e poi si è scoperto che i database relazionali utilizzando archivi di riga, non potevano nemmeno eseguire query veloci, erano necessari gli archivi di colonne. E poi abbiamo scoperto che se davvero volessi fare query grafiche sui dati, né un archivio di colonne né un database relazionale andrebbero bene, e in realtà avevi bisogno di avere un database specifico per i grafi creato per te. Poi sono arrivati i database RDF e non appena hai iniziato a considerare il significato della semantica e abbiamo ottenuto i database NoSQL, molto, molto specificamente per la velocità. Chiamarli NoSQL è quasi come se tu stessi marchiando tutti questi database come se fossero gli stessi, in realtà sono radicalmente diversi in ciò che sta sotto. L'unica ragione per cui portano il nome NoSQL è che non gliene frega niente di SQL perché è troppo costoso. Le latenze delle transazioni di cui hanno bisogno.
L'IoT - che pensavo di finire sullo stesso punto su cui Dez l'aveva finito - non è finita, tutta questa situazione in termini di velocità e requisiti di latenza, non è finita fino a quando la donna grassa non inizia a svelare questi dati e non sono ancora veramente iniziati. Molti di questi dati vorranno avere le latenze che ho indicato, quindi penso che sia tutto ciò che devo dire. Passiamo ad Aerospike e Brian Bulkowski.
Brian Bulkowski: Ciao, grazie mille per essere entrato a far parte del Bloor Group e di me stesso per questa presentazione oggi. Nel pensare a ciò di cui Dez e Robin stavano parlando, vorrei parlarvi un po 'del percorso che Aerospike ha intrapreso nel fornire la nuova tecnologia di database e la tecnologia di database NoSQL a numerosi settori. È stata una grande strada. Abbiamo avviato Aerospike nel 2008 vedendo molte delle tendenze citate da Dez e Robin. In particolare sul fatto che i database in memoria siano in grado di sfruttare il flash, nonché il tipo di sistemi cloud scalabili e il tipo di scala richiesta per personalizzare la personalizzazione, l'analisi del comportamento e il tipo di esperienze VIP di celebrità che sono state discusse.
Quando abbiamo affrontato il problema di un database che era un database operativo front-end in grado di fornire le basi alle applicazioni che potevano essere scritte per risolverli, abbiamo iniziato con il problema di come possiamo essenzialmente costruire una tabella hash distribuita, memoria - Tabella hash distribuita sorprendentemente veloce e capace di cose come milioni di transazioni al secondo, ma a un prezzo ragionevole. Quando abbiamo finito il nostro prototipo, ci siamo resi conto che allora avremmo dovuto capire chi potrebbe aver bisogno di questo tipo di velocità. Essendo una società della Silicon Valley, abbiamo rapidamente scoperto che era davvero l'industria pubblicitaria in grado di consumare questo tipo di informazioni ed era interessata a ciò, quindi mi piacerebbe passare un secondo a parlare delle offerte in tempo reale e di come mercato funziona.
Robin ha menzionato il funzionamento del trading finanziario, che è la prima transazione che spesso è la transazione vincente e che in sostanza esiste un time-to-market di latenza e un valore di latenza. Il settore pubblicitario è leggermente diverso, in un modo interessante, perché l'obiettivo della pubblicità è un particolare - ciò che si chiama un'impressione, la capacità di pubblicare un annuncio - è un'asta e quell'asta va da dieci millisecondi a cinquanta millisecondi. Il nome del gioco, e spesso ci sono centinaia di aziende che fanno offerte in tempo reale su ogni singolo annuncio che viene posizionato su Internet, è quello di ottenere la maggior quantità di dati e portare i migliori algoritmi da sopportare in quei dieci o cinquanta millisecondi nel maggior quantità di dati.
Questo cambiamento e cambiamento si stavano verificando nel settore pubblicitario, in ognuno di quei pochi millisecondi, hanno una complicazione limitata nel tempo con i migliori algoritmi per la maggior quantità di dati, e per fare questo stai mettendo insieme un sacco di piccoli pezzi di dati. Informazioni recenti sull'indirizzo IP, informazioni recenti su una particolare categoria di dispositivi, informazioni recenti sul comportamento del sito Web, termini di ricerca recenti, tutto andrebbe nel segreto degli algoritmi di una determinata azienda per determinare un prezzo e un'offerta.
Questo è stato un mercato affascinante di cui far parte. Abbiamo fatto per la prima volta la nostra prima implementazione su Aerospike nel 2010 con alcune delle prime aziende che lavoravano seriamente nell'economia delle offerte in tempo reale, e poi abbiamo raggiunto, fondamentalmente quel deposito front-end di dati comportamentali, per la maggior parte delle aziende in quel spazio. Ciò che abbiamo scoperto da allora, ed è un'architettura particolare che descriverò nel corso di questa presentazione, è che è successo tutto nel 2010, 2011, 2013 e continua ad evolversi. La pubblicità è un mercato molto dinamico.
Ma quel tipo di esperienza VIP, puoi pensare di posizionare l'annuncio giusto, non inserendo un annuncio per dire prodotti per bambini, perché non ho figli, quindi non avrò un annuncio efficace se è posto su quello, ma se si tratta di macchine veloci è il tipo di annuncio da pubblicare a Brian. Questo è davvero il tipo di esperienza VIP nelle offerte, se scontare o meno, se sei su un sito di vendita al dettaglio, anche nel rilevamento di frodi. È questo il normale schema di una determinata persona o una particolare carta di credito? Tutta quella forma di tecnologia di analisi in tempo reale, di previsione comportamentale, di analisi predittiva, ora si sta diffondendo dal settore pubblicitario, che lo sta facendo per divertimento e profitto da diversi anni, e sta davvero entrando nella vendita al dettaglio e bancario, e rilevamento delle frodi, ecc., attraverso una particolare architettura. Pertanto, Aerospike ha avuto il privilegio di far parte di numerosi casi.
L'architettura che vediamo funzionare ed essere pratica per farlo, è quella in cui invece di creare una serie di query da un server delle applicazioni, invece di spostare una parte maggiore del calcolo sul server delle app stesso e quindi utilizzare un database essenzialmente come memoria motore per il tipo di oggetti di cui parlava Robin. In questo caso, queste architetture, prima di tutto, non confondono questo con la tua analisi reale qui. Si vede sul lato destro di questa diapositiva che c'è ancora un'analisi qui per generare intuizioni. Si tratta di lavori che spesso lavorano su petabyte, decine di petabyte di dati, persino exabyte nei casi di alcuni dei nostri grandi clienti, utilizzando una varietà di tecnologie. Devi avere un team di big data, un team di analisi, un team quantitativo là fuori per capire cosa, diciamo, le coordinate geospaziali contano, quali modelli funzionano in termini di ricerca di tali relazioni e creazione dell'esperienza VIP. Questo è un problema a sé stante e non a cui Aerospike ha partecipato direttamente, e c'è un sacco di grande tecnologia quando hai a che fare con quel tipo di sistema.
Ciò di cui siamo stati entusiasti e con cui abbiamo lavorato con l'industria è, una volta acquisiti questi approfondimenti, in che modo intraprendi il tipo di transazione machine-to-machine o machine-to-human, in cui acquisisci tali approfondimenti e realizzi loro reali per ogni persona, momento per momento? L'architettura che abbiamo visto usare è quella in cui c'è un application server scritto e sta facendo tutto quel calcolo matematico e guardando attraverso i modelli che hai creato, guardando il comportamento recente e facendolo essenzialmente su un paradigma chiave o almeno un sistema molto leggero.
Quando hai a che fare con i tipi di dati di cui stiamo parlando, il tipo di flussi di cui stiamo parlando, con milioni di scritture al secondo, milioni di letture al secondo, milioni e centinaia e migliaia di decisioni per secondo, costruire indici complessi, indici multidimensionali, semplicemente non funziona molto bene, non è scalabile. Il modo per raggiungere questa forma di scala è di impegnarsi molto nel parallelismo. Parleremo un po 'di come lo facciamo più tardi. Ma parte di questo è un server di app senza stato scritto nella tua lingua.
Quello che vediamo spesso è un particolare progetto che presuppone un nuovo framework applicativo basato sulle persone che vi lavorano, sulla tecnologia che stanno utilizzando e sul problema a cui si stanno avvicinando. Abbiamo visto persone che usano Python, molte persone usano Java, vediamo ancora programmatori C, perché molti di questi sono ancora ad alte prestazioni, forse anche usando cose come le vecchie librerie MATLAB. E devono toccare migliaia e migliaia di punti dati al secondo per prendere una decisione efficace.
Una domanda che mi sono posto qualche volta è: "Bene, Brian, se sei capace di milioni di transazioni al secondo, chi ne ha bisogno?" Se guardi, ad esempio, l'elaborazione dei pagamenti in Nord America, e Aerospike è coinvolto soluzioni che effettuano il rilevamento delle frodi all'interno di quel sistema e che supportano gli autori di applicazioni che stanno facendo cose molto innovative nel rilevamento delle frodi, ci sono solo poche migliaia di transazioni di pagamento al secondo che attraversano anche il più grande dei processori di pagamento. Eppure, quando la prima azienda venne da noi e disse che stavano cercando di usare NoSQL e che volevano vedere come sarebbe stata la nostra soluzione alla base della loro applicazione, dissero che volevano toccare 5.000 pezzi di dati in una finestra di 750 millisecondi. Bene, ora all'improvviso hai qualche centinaio di transazioni commerciali e alcune migliaia di dati da considerare in ogni calcolo, e ora sei nell'area di aver bisogno di milioni di transazioni al secondo.
Il caso di - mettere da parte la pubblicità per un secondo, il caso della frode è affascinante perché dove c'è denaro, c'è frode e la prevenzione in tempo reale della frode, invece di cercare di risolvere analiticamente dopo che si è verificata una frode, è davvero un questione di portare online quanti più dati possibili e puoi pensarli come riflesso di quell'esperienza VIP. Questa persona si comporta in un modo che di solito non si comporta? E così, aumentano le possibilità che si tratti di un sistema fraudolento, e non proprio di questa persona. Questa persona di solito accede tramite un determinato dispositivo o set di dispositivi, con un determinato set di risoluzioni dello schermo? Di solito esibiscono un particolare modello di acquisto comportamentale? Forse possiamo eliminare la frode sul nascere nel corso della transazione stessa. Ciò dovrebbe ricordare molto il tipo di cose che accadono all'interno di una transazione nel sistema pubblicitario.
I tipi di sistemi che risolviamo sono quelli in cui ogni singolo processore di pagamento ha un grande team di dati, hanno molti dati storici, stanno creando nuovi modelli, non condividono con noi su Aerospike tutti i modelli, perché sei davvero una salsa segreta. Se sei un abbonato a Gartner e hai sentito parlare di Gartner dell'economia dell'algoritmo, si tratta di un algoritmo e di una società che combattono testa a testa per ridurre le frodi e aumentare il numero di transazioni riuscite, perché non non voglio bloccare le transazioni. Questo è il tipo di progetti che cerchiamo in Aerospike a questi livelli di scala.
Un altro caso su cui abbiamo lavorato con società di servizi finanziari è quello che viene chiamato Intraday System of Record. In questo caso, quello che sta succedendo è che il tipo di esperienza più ricca, anche in un sistema di trading al dettaglio, è quello in cui voglio essere in grado di guardare la mia posizione particolare e voglio farlo in modo estremamente accurato. Non voglio avere un problema di fronte al mio sistema DB2. Invece, voglio guardare i dati esatti, e tra i dispositivi mobili, ma anche cose come un ricalcolo del rischio, i ricalcoli del rischio ora dovrebbero essere fatti su una base minuto per minuto, vuoi essere in grado di ricalcolare il rischio di tutti così come il rischio globale, il rischio sistemico in tutta l'azienda in pochi minuti.
E ancora, è lo stesso problema. Ogni singolo account che è un particolare, lo considera come una ricerca di valore chiave per un particolare oggetto, quindi questo può essere fatto in parallelo e, soprattutto, questo paradigma ti consente di scrivere il tuo codice e i tuoi algoritmi in un linguaggio di alto livello, che è più facile da eseguire il debug e un time to market più veloce. In questa economia di algoritmi, devo essere in grado di mettere online i miei algoritmi. Questo è un problema molto diverso per la modellistica e le relazioni commerciali, che è ciò a cui i sistemi relazionali sono bravi. Quando hai una tabella di parti e quelle parti sono associate agli ordini e quegli ordini sono associati alle persone, hai un processo aziendale che può essere strettamente modellato e probabilmente non cambierà per tutta la vita della tua attività. Tuttavia, un nuovo algoritmo per trovare un nuovo modello di frode deve essere scritto in modo accurato e rapido e reso online, prendendo decisioni aziendali nel giro di pochi giorni, se non più velocemente. Una soluzione NoSQL per questo tipo di sistema di registrazione è davvero un sistema straordinario per questi ragazzi, perché consente loro di inserire dati molto rapidamente, nonché di creare nuovi algoritmi, quindi non solo una nuova esperienza del cliente nell'affrontare i dispositivi mobili, ma in realtà costruendo una vasta gamma di nuove applicazioni.
Ciò che vediamo a lungo termine su Aerospike è il fatto che ogni tipo di database, ogni layout fisico dei dati su disco ha i suoi componenti, e su Aerospike siamo davvero concentrati su questo valore chiave o sistema orientato al ruolo, come ha detto Robin, con un'elevata coerenza transazionale, e consente davvero a persone come archivi di colonne e data lake ad alto volume e sistemi di transazione hardcore che hanno avuto anche dei vincoli di segnalazione. Vediamo tutti che hanno bisogno di inserirsi in una varietà di motori di query diversi. Vediamo alcuni dei motori di query basati su JSON. Vediamo cose come la ricerca elastica, vediamo Spark, tutti hanno bisogno di varietà diverse in momenti diversi di cose come i negozi di colonne, così come i negozi di fila, che è dove eccelle Aerospike.
Vediamo davvero che questi diversi tipi e l'industria stanno arrivando a un punto in cui scegliere il meglio della razza di ognuno di questi sarà una necessità. Sfortunatamente, a causa della realtà dell'analisi a lungo termine e dell'analisi dei lavori in batch rispetto a quella dei vincoli e dei vincoli operativi, probabilmente non arriveremo al punto di avere un'unica dimensione unica per tutti, ma arriveremo al punto di essere in grado scegliere chiaramente tra alcuni dei layout di dati di base.
Parliamo per un minuto dell'innovazione del flash. Ricevo ancora la domanda, anche se, come è stato commentato in precedenza, Flash è con noi ormai da molto tempo. Quando abbiamo iniziato Aerospike nel 2009 è stato quando, credo, nel 2009, forse, sì, il 2009 è stato quando Intel è uscita con l'X25, che era in realtà la prima unità flash SATA presidiata sul mercato di massa, e prima c'erano diversi sistemi flash, ma in realtà è stato quello che ha fatto irruzione nella coscienza della tecnologia. Successivamente, Fusion-io ha portato il flash nel più ampio mercato aziendale.
Quello che sta succedendo ora è l'avvento di un sistema chiamato NVMe. NVMe è uno standard simile a SATA o SAS o addirittura SCSI che consente a diversi produttori di schede di interagire con i driver all'interno del sistema operativo con un elevato livello di efficienza. Quindi sta creando un livello superiore di prestazioni, prima di tutto perché NVMe si basa su PCIE come il suo trasporto sottostante, che è molto più veloce di SATA, SAS o qualsiasi altra cosa, ma consente anche i driver migliori.
Ad esempio in Linux c'è questo ragazzo Jens, e Jens è la guida del driver NVMe, Jens Expo, e sta facendo un lavoro migliore di quanto qualsiasi individuo che Intel o Fusion-io avrebbero potuto fare con il loro driver individuale, con tutte le loro risorse. Quando hai la potenza del sistema operativo stesso in grado di creare il miglior driver, stiamo assistendo a livelli di prestazioni davvero sorprendenti. Tutto ciò conferma l'idea che il flash può davvero fornire molta della bassa latenza della RAM.
Ora, Aerospike è ancora un ottimo database RAM a causa del suo modello di cluster, tuttavia, scopriamo che una volta che si esegue un hop di rete, che è necessario disporre di memoria scalabile, si stanno già spendendo almeno da 5 a 50 microsecondi, il 70 microsecondi extra di NAND di solito non sono un impedimento e potresti anche usare il flash, dato che NAND flash, dato che la rete è già coinvolta in questo. Molte persone poi si chiedono come: tutto questo suona alla grande se stai acquistando il tuo hardware, come stanno andando i cloud pubblici? Penso che troverai subito, indipendentemente dal cloud pubblico che stai utilizzando, quei cloud pubblici hanno offerte flash molto potenti. Differisce un po 'dal provider cloud al provider cloud. Amazon ha i suoi casi I2 che sono stati pubblicati per un anno, due anni ormai, che sono dispositivi flash di qualità davvero piuttosto elevata, e Aerospike ha il modello di distribuzione sopra di essi.
Vorrei chiamare in particolare Google Compute, Google Compute Engine, Google Cloud, perché nella nostra esperienza hanno finora alcuni dei dispositivi con le prestazioni più elevate e alcuni dei più flessibili in termini di modelli di implementazione. Ma vedi anche nuovi schemi di distribuzione come Pivotal, che è una sorta di pubblico / privato, quindi puoi fare app Pivotal giuste in entrambi i luoghi che supportano il flash e supportano diversi dispositivi di archiviazione e modelli Docker. Quindi, davvero, questo è un punto nella storia in cui il flash non è solo disponibile per l'acquisto e l'inserimento nei data center, ma è affondato in tutti i fornitori di infrastruttura, perché è davvero il modo migliore per ottenere sistemi IOPS elevati una latenza molto ragionevole.
Solo un momento su Aerospike: Aerospike è un database distribuito in cluster, che lo rende molto adatto a implementazioni in stile cloud e data center. Scopriamo che la flessibilità di poter aggiungere più dati e più prestazioni è assolutamente necessaria in questo tipo di nuove applicazioni nette perché si avvia un progetto, non si sa se sono necessarie cinquantamila transazioni al secondo, centomila, un milioni, due milioni, quindi vuoi darti un po 'di margine per poter aggiungere server. Eppure, vuoi ridimensionare in modo che ogni server sia in grado di essere veloce da solo. Non vuoi davvero finire con cinquecento o mille server che sono server di database lenti. Il ridimensionamento non è l'unico gioco in città, il suo ridimensionamento e ridimensionamento, come diceva Dez in precedenza, c'è un nuovo asse Z.
Spero che questo ti dia alcune nuove idee su come la velocità e la scala si rivolgono a nuovi mercati e forse ci sono progetti su cui stai lavorando in cui sarai in grado di considerare davvero la creazione di applicazioni più ricche e l'utilizzo di un framework applicativo con una chiave in più valore o database NoSQL al di sotto di esso. In Aerospike ho sicuramente visto molti dei nostri clienti e molti dei nostri utenti open source avere successo con questo modello e non vedo l'ora che il settore lo adotti in misura maggiore.
Rebecca Jozwiak: Grazie mille Brian, e sono sicuro che Dez e Robin hanno alcune buone domande per te. Robin?
Dez Blanchfield: Sono felice di saltarci dentro. Robin, hai una domanda? Altrimenti ne ho una rapida che posso iniziare.
Robin Bloor: Mi dispiace, ero in sordina. Mi sono tuffato, ma nessuno mi ha sentito. La domanda mi è immediatamente venuta in mente, perché si tratta di un insieme molto sofisticato di capacità tecnologiche. In termini di clienti esistenti che hai, qual è il tipo di escalation o tasso di transazione che stai riscontrando su alcune di queste applicazioni pubblicitarie? Il tasso di transazione continua ad aumentare? E se sì, a che tipo di tasso?
Brian Bulkowski: domanda interessante, Robin. Ogni settore ha la sua curva in ogni azienda. Prendiamo la pubblicità nordamericana, ad esempio nel 2012, la pubblicità nordamericana stava probabilmente andando più vicino a 200.000 annunci al secondo, in una sorta di intraday standard, non ai miei tempi, e ora è probabilmente aumentata a circa 3-5 milioni di annunci al secondo. Ma poi è successa una cosa interessante. L'industria pubblicitaria ha iniziato a risolvere alcuni problemi di frode e le parti del settore che sono in grado di bloccare la frode, hanno visto un calo dei tassi di transazione, circa un fattore due, all'interno di alcuni dei nostri clienti più sofisticati in grado di determinare la frode. Ovviamente hanno dovuto fare alcune ricerche nel database per bloccare la frode, quindi alla fine alla fine è diventato quasi lo stesso.
Un caso d'uso interessante è all'interno delle telecomunicazioni, non ho detto che le telecomunicazioni aumentano a causa della fatturazione basata su ogni singolo pacchetto che passa attraverso la rete del telefono cellulare. Ai vecchi tempi, avevamo chiamato i record dettagliati e una volta al minuto, una chiamata, quello che sai, un piccolo ping passava attraverso la rete e a questo tizio resta ancora un minuto? Ora dobbiamo costruire e persino instradare in base a ogni pacchetto su Internet. Questo è un - scusa all'interno di una rete mobile, che ora è improvvisamente milioni di pacchetti al secondo e qualcosa che sta crescendo continuamente. Quindi un caso è che ogni applicazione sta guidando un bel po 'di 2X all'anno. All'interno di alcuni clienti, vediamo: "Ma aspetta, ho una nuova applicazione. Voglio aggiungere alcune frodi al mio rischio. Voglio aggiungere un'esperienza cliente più profonda alla mia frode e al mio rischio. ”Ognuno di essi crea un nuovo carico sul database sottostante.
Robin Bloor: Sì, voglio dire, penso che era quello a cui stavo accennando nella breve presentazione che ho dato, che questi - pensavamo che una transazione fosse, qualcuno fa qualcosa e forse c'è una cascata di eventi e tutto viene registrato e ora molte transazioni hanno un'enorme quantità di ricerche e tu hai fornito alcuni esempi nella presentazione. E quindi non stai più eseguendo una transazione, stai effettivamente eseguendo un tipo di applicazione che può avere molti, molti elementi.
L'altra domanda prima di passare a Dez - perché ovviamente stiamo tag tag teaming su questo - l'altra domanda a cui vorrei che tu rispondessi se hai una risposta ragionevole ad essa, è sia Dez che mi aspetto che Internet Le cose, o Internet of Everything come viene talvolta chiamato, per creare una quantità abbastanza drammatica di traffico transazionale. Puoi parlarci? È questa la tua esperienza, hai clienti che vengono da te con quel particolare tipo di problema, e qual è la tua opinione al momento?
Brian Bulkowski: Certo, penso che ci sia un po 'di confusione, e per dirla in parole povere, sull'Internet of Things. I clienti che vedo finora stanno semplicemente portando Internet alle cose che hanno. Pensa a quei pulsanti Amazon - è tutto Amazon - quei pulsanti, non puoi riutilizzarli e farli andare su Walmart online. Non è come un browser che puoi mescolare e abbinare tutto. D'altra parte, sta succedendo machine-to-machine e quando si collega l'auto Tesla per caricarla, Tesla invia un enorme flusso di informazioni, ogni singolo sensore nell'auto, ma scorre nel computer di Tesla per l'analisi e il miglioramento qualità. Quello che vedo è tutto da macchina a macchina e tutti i sensori all'interno di una singola azienda, creando nuove richieste.
Ora per lo più oggi, questo scorre in questi sistemi analitici e prendiamo il caso di Tesla; Il primo utilizzo di Tesla, a quanto ho capito, è stato quello di migliorare la durata della batteria, in "Quali sono le temperature operative, quali sono i carichi? Diamo un'occhiata, progettiamo una batteria migliore. ”Ma poi iniziano a pensare, ed è tutto fantastico, è una specie di problema di analisi profonda che è affascinante, la domanda successiva è:“ Come posso migliorare l'esperienza momento per momento ?”
Ora prendiamo il caso come Nest, dove stai cercando di fare analisi predittive per cambiare momento per momento la temperatura di una casa. Questo è il tipo di caso in cui iniziamo a vedere in Aerospike, dove c'è questo enorme lago di dati e ci sono questi enormi processi analitici, ma cosa farò ora? Dovrò tenerlo, pensarlo come il denaro, una parte dell'ultima settimana, l'ultimo mese, forse anche solo il valore delle informazioni dell'ultimo giorno, probabilmente su un back-end perché abbiamo a che fare con un semplice sensore dispositivi e farò un set di analisi in quel momento per momento per cambiare le esperienze. Quel tipo di esperienze tipo Nest, per le quali vedo i casi d'uso di Aerospike.
Robin Bloor: Okay, la cosa che mi aspettavo con l'Internet of Things, era che avresti iniziato a ottenere i trigger di soglia e che avrebbero iniziato a creare cascate di eventi. Hai visto qualcosa del genere, o non è qualcosa che non hai ancora visto?
Brian Bulkowski: Io e Dez - stavo solo chiedendo il parere di Dez su questo quando stavamo chattando prima dello show. Quello che non ho ancora visto è il tipo di cascata dei dati di una società che si riversano in un'altra società, che il mio frigorifero Samsung sta parlando con la mia lavatrice LG perché ha appena capito che ho versato un sacco di cioccolato su tutto il pavimento, quindi quel tipo di azienda per azienda dispositivo per dispositivo, penso che sto ancora aspettando questo in termini di Internet of Things. Penso che ci siano alcuni problemi nel mondo degli affari e della sicurezza che sono per lo più non tecnici che devono essere risolti per vederlo.
Robin Bloor: Okay, Dez?
Dez Blanchfield: In realtà ho delle opinioni molto forti su quel particolare ultimo punto, che introdurrò brevemente nella conversazione. Penso che spesso il business e la tecnologia pensino che guidino effettivamente da dove viene la domanda, ma quando guardiamo cosa è successo quando l'iPhone è diventato una cosa, e nella mia mente era una specie del primo dispositivo mobile, se perdonerai il gioco di parole, ma un dispositivo che potrebbe essere portato in giro che può effettivamente eseguire molte piccole app in tasca, e ha portato a una trasformazione significativa di ciò che pensavamo di essere un computer. Molte persone pensano agli iPhone o agli smartphone o ai telefoni Android come telefoni, ma non lo sono, in realtà sono solo un piccolo computer che esegue app e una delle app che esegue effettua chiamate, e non sono le chiamate a cui pensiamo più, non sono una chiamata punto-punto analogica come ha sottolineato Brian, sono piccoli pacchetti che vengono instradati.
Ma il più delle volte, ciò che abbiamo visto è che questa insurrezione di smartphone in realtà non viene realmente utilizzata per effettuare chiamate che spesso, il 98% di ciò che faccio sul mio smartphone non sono chiamate. È tutto fuorché chiamate, sono app. Penso che questo effetto a cascata - e sono ansioso di portarlo rapidamente a una domanda - ma l'effetto a cascata è in realtà causato dai consumatori, e in effetti ho questo unico rivestimento che butto abbastanza spesso per ottenere un sacco di CXO seduto nella stanza e prestando attenzione se penso che si stanno addormentando con la presentazione che sto facendo, cosa che non succede troppo spesso, si spera.
In un certo senso ho detto che l'interruzione che stai vedendo nella tua attività non è in realtà guidata esclusivamente dalla tecnologia, è il più delle volte non guidata dai tuoi clienti. E in un certo senso si siedono e si chiedono, cosa significa lì? Quindi, quando penso all'uso della tecnologia, intendo dire che abbiamo visto USENET, abbiamo visto accadere tutto questo genere di cose divertenti su Internet, ma non molte persone hanno predetto i social e il loro impatto. Tutti vogliono dire a tutti cosa hanno mangiato a colazione, e il rumore che hanno creato e la tecnologia di backend che avevamo, e poi ovviamente la pubblicità sta cercando di riempire di cose.
Penso che vedremo un effetto a cascata fino a un punto in cui i dispositivi stanno parlando con i dispositivi, i consumatori stanno semplicemente recuperando il significato di ciò che effettivamente significa e ciò che può fare. Hai sollevato un punto interessante sul perché il pulsante Amazon non parlerà con Walmart. Pubblicherò questa domanda, cosa succede quando Walmart ottiene il proprio pulsante, e poi cosa succede se le prime venti Amazzoni e Walmarts e le altre principali reti di distribuzione e vendita al dettaglio ottengono tutti i propri pulsanti? Dove ci porta? In particolare, la mia domanda con Brian sarà: “Dove stiamo andando con questo paradigma di performance completamente nuovo? Sei all'avanguardia, e stai lavorando con aziende che lo fanno sia a livello di infrastruttura fisica che a livello di trasferimento di dati. Dove ci porta questo, quando arriva la prossima grande ondata? Che tipo di intuizione puoi condividere con ciò che sta accadendo nel backend della tua esperienza? ”
Brian Bulkowski: Certo, il modo in cui penso a molte di queste cose è quello di concentrarmi sulle esperienze degli utenti ed esattamente quello che hai detto, sono gli utenti che guidano, anche se, come tecnologi e uomini d'affari, potremmo trovare un idea intelligente che pensiamo piaccia agli utenti e tornerò indietro all'esempio Nest. Quando mia sorella ha installato Nest nella sua casa, ha detto: “La mia casa è più tranquilla, posso sentire le cose. Non è solo che sto pagando meno per il potere ", lo è, ma ora non puoi strappargli quel Nest dalle mani perché le piace stare in una casa più tranquilla rispetto a quella in cui il riscaldamento sta soffiando al massimo e poi spegnere di nuovo.
La domanda finisce per essere: quali sono le esperienze dell'utente che possiamo potenziare? Questo finisce per essere quell'esperienza di qualità della vita, che se avessimo i soldi e fossimo nel primo mondo, pagheremmo molto. Ti faccio un esempio da casa mia, alla mia ragazza piace il latte freddo. Le piace molto il latte freddo, e così spesso dobbiamo cercare di capire dove sarà abbastanza freddo nel frigorifero e non surriscaldare il resto delle cose. Bene, questo è fantastico - e ho detto alla mia ragazza, "Pagheresti $ 10 al mese per avere latte freddo e non avere salumi surgelati?" Era tipo "Assolutamente". E ottenere $ 10 al mese da qualsiasi consumatore è dura.
Penso che in queste esperienze dobbiamo davvero tenere d'occhio quella che è l'esperienza del consumatore che potrebbe davvero essere guidata. Penso che fosse parte del segreto dell'iPhone. Penso che sia parte del segreto di Tesla costruire un'auto migliore con tutti i dati, abolire l'idea di un ciclo del prodotto e un rilascio annuale e apportare miglioramenti continui su ogni parte. Dovremo trovare alcune idee intelligenti su come utilizzare effettivamente tutti questi dati in modo convincente momento per momento per la vita delle persone.
Dez Blanchfield: Sì, è una grande intuizione. Partendo da quello, l'altra estremità dello spettro, che riecheggia esattamente con il genere di cose che stiamo vedendo ora con ciò che i consumatori chiedono, e tutti noi abbiamo qualcosa in casa che è fredda e calda. L'altra estremità dello spettro è quindi, e lo abbiamo visto in una sorta di tradizionale "mondo dei big data" in cui le assegnazioni dei dati stanno diventando più rare dei denti di gallina e quelle che sono sul mercato vengono offerte più di quanto guadagnino i CIO in alcuni casi, i tipi di aziende con cui stai lavorando e i tipi di sviluppo che hai visto, è il caso che i tipi di sviluppatore, il tipo di architetto di dati e gli speciali di rete, stiano diventando sempre più difficili da trovare ? Abbiamo bisogno che le organizzazioni inizino a pensare ora a anticipare la curva del tipo di competenze di cui hanno bisogno nel back-end per il tipo di sviluppatori e architetti di dati? Che cosa stai vedendo a quel livello per quanto riguarda le risorse di abilità che capiranno come mettere in pratica questa tecnologia adesso?
Brian Bulkowski: Sì, penso che sia una delle sfide che devono affrontare le organizzazioni con cui ho parlato. Che si tratti di un - i peggiori problemi di cui ho sentito parlare sono in realtà una sorta di grandi imprese, perché se dici: "Vengo da questa grande banca, vengo da Chase ed ero un architetto di dati", allora tu ' ho il mondo la tua ostrica e il tuo stipendio sale di molto, quindi c'è questo sfavorevole problema di trovare un lavoro in uno di quei posti perché non ci sono abbastanza persone, e quindi riuscire a passare da un lavoro all'altro. Non sento nient'altro che quel tipo di problema, ed è in realtà uno dei motivi per cui ho focalizzato Aerospike sull'uso di strumenti adeguati per il particolare team di progetto.
Invece di provare a entrare in un team di progetto e dire: "Ehi, dovresti usare il nostro linguaggio di query". Guarda, se quei ragazzi, stanno guidando l'autobus in questi giorni, ragazzi e ragazze, e se usano un particolare linguaggio di query e utensili, continueranno a farlo, e non posso parlarne in nient'altro. Il mio obiettivo è quello di essere in grado di mettere il tipo di potenza di Aerospike come un database dietro qualsiasi strumento che stanno usando e che fa parte di questa idea, le diapositive che vedrai sul futuro del database Poliglot. Devo supportare i modelli di applicazione e analisi tra questi ragazzi, perché è davvero difficile cercare di trovare persone con background matematico e capacità statistiche per navigare in questo mondo.
Dez Blanchfield: Un'altra cosa interessante di cui le persone potrebbero non essere consapevoli, intendo che Aerospike è un giocatore molto forte nel mondo open-source, sono desideroso di ottenere una visione molto rapida del tipo di cosa significhi quanto il business funziona e cosa fa per te. Hai detto che hai lavorato direttamente con le persone che stanno facendo le cose fino al livello del kernel all'interno, quindi il kernel Linux. Ci sono alcuni grandi giocatori che si trovano in questo spazio, e ci sono alcuni marchi famosi che non menzioneremo, ma un'organizzazione come Aerospike, nella tua storia recente più moderna, l'esperienza open source, come si adatta al quadro generale e quali vantaggi competitivi hai visto che ti danno?
Brian Bulkowski: Certo, quando siamo passati all'open source nel 2014, l'abbiamo fatto perché ci siamo resi conto che un'infrastruttura di base, come un database, deve essere disponibile come fonte, deve essere affidabile e un naturale contrappeso tra il vecchio mondo del chiuso fonte, e una volta che investi in un particolare database, quei ragazzi ti mettono in balia del ciclo tecnologico dopo il ciclo tecnologico e deve esserci un equilibrio. Dobbiamo essere in grado di mettere in evidenza versioni che fanno cose nuove, e forse che è in una versione aziendale, dobbiamo avere un modello a doppia licenza che ha una versione open source per le persone che prendono a calci le gomme che stanno facendo un lavoro senza scopo di lucro, nonché una versione aziendale che è una licenza proprietaria e consente un lavoro illimitato.
E ovviamente avremo anche i massimi livelli di velocità e scala, essendo una versione aziendale. Crediamo nel modello di licenza per duelli, ed è stato fantastico per la nostra attività. Vogliamo che le persone inizino con Aerospike, vogliamo piccoli progetti per calciare le gomme, è semplicissimo andare su Amazon, lanciare uno script di conferma e far funzionare un cluster Aerospike entro cinque minuti. D'altra parte, vogliamo dare di più ai clienti aziendali.
Dez Blanchfield: ci stiamo avvicinando alla cima dell'ora, quindi tornerò a Rebecca tra un momento, ma se ci fosse un solo liner che vorresti buttare lì, una sorta di consiglio daresti alle persone che stanno cercando di entrare nello spazio della tecnologia che hai portato sul mercato e come lo adotteranno, cosa diresti che il primo passo per loro è quello di immergere almeno il loro punta e inizia a guardare come otterranno un vantaggio competitivo dalla tua piattaforma?
Brian Bulkowski: Certo, parte del messaggio qui è che ci sono livelli di velocità e abilità che ora sono facili. Non è necessario un cluster Cassandra a mille nodi per ottenere milioni di transazioni al secondo. Puoi farlo anche nelle prime fasi del tuo progetto. Quindi le cose sono molto più facili di prima. Quindi il secondo consiglio è che dovrai elaborare, proprio come stai dicendo, modelli di coinvolgimento dei clienti nei processi di business matematici che utilizzano tutti questi dati, quindi la buona notizia è che i dati sono disponibili, il la brutta notizia è che devi effettivamente trovare alcuni schemi e alcuni casi d'uso convincenti.
Dez Blanchfield: Sì, un ottimo consiglio, quindi adesso restituirò a Rebecca. Grazie mille per questo, è stata una bella chiacchierata sulla tecnologia, lo apprezzo.
Rebecca Jozwiak: Grazie, Dez. Ho un paio di buone domande da parte del pubblico. Fammi vomitare questa diapositiva. So che hai parlato del sistema di record e roba del mainframe, ma quanto spesso vedi un offload assoluto o la replica è una riconciliazione di fine giornata, una specie di cosa vedi di più?
Brian Bulkowski: Quello che vediamo in Aerospike sta usando un database NoSQL di fronte a quel sistema di riconciliazione di fine giornata. Hai bisogno di intraday, la risposta corretta. Non puoi avere la risposta sbagliata, e questo è ciò che Robin ha detto sull'asset è sottovalutato, ma i processi aziendali attorno ai requisiti legali della riconciliazione possono diventare piuttosto complicati e ci sono decenni di tecnologia e decenni di legge e pratica legale per fare la riconciliazione. Quindi quello che vediamo su Aerospike è che eseguirai i tuoi algoritmi su un database più caldo con più transazioni al secondo. Ma per motivi legali, hai assolutamente bisogno di un sistema di riconciliazione che abbia attraversato quei processi legali. Vediamo entrambi e vediamo che questa è essenzialmente la pratica IT a due livelli esposta da persone come Anderson Consulting e Gartner in una certa misura. Ne vediamo molto.
Rebecca Jozwiak: Okay, bene. Qualcun altro ha mostrato interesse per questa particolare diapositiva, ha detto che era davvero interessante e si chiedeva se si potesse semplicemente approfondire un po 'di più il confronto tra flash e memoria.
Brian Bulkowski: Certo, fammi prendere una barra laterale veloce, ancora una volta, so che siamo vicini alla fine dei tempi. Beh, il flash è memoria - sono i chip - tendo a pensare alla RAM. Quindi la RAM ha caratteristiche particolari, richiede molta potenza, è ottima sia per le scritture casuali che per le letture casuali. Dove NAND è in grado di leggere letture casuali e di potenza inferiore, ma è molto male nelle scritture casuali. Ci sono alcune sottili differenze nel funzionamento di questi due chip a livello della litografia, che creano una serie di differenze tecniche.
Nel caso in cui stai facendo analisi e devi saltare molti dati, o nel caso dell'Aerospike, dove hai gli indici, gli indici sono ancora molto buoni da usare nella RAM a causa del parallelismo e dell'accesso casuale. È richiesto un livello superiore di accesso casuale. In Aerospike, tuttavia, troviamo l'uso di quegli indici per trovare un particolare oggetto o un blocco di dati, questo è il posto appropriato per raggiungere una NAND perché diventa una specie di negozio più grande sotto gli indici. Questa è quindi una transazione su un dispositivo di archiviazione, ma ancora dopo aver fatto molte potenzialità e filtri all'interno del tuo sistema di indicizzazione.
Rebecca Jozwiak: Okay, bene. E poi, so che abbiamo già parlato molto dell'IoT e un commento dei partecipanti ha detto che l'IoT è ampiamente vantaggioso, ma le aziende, le entità governative e gli sviluppatori stanno crescendo in modo sicuro e proteggendo i dati alla stessa velocità, pensi?
Brian Bulkowski: Forse Dez, ti piacerebbe saltarci dentro?
Dez Blanchfield: Sì, sono felice di saltarci dentro. Penso che la risposta sia no. In effetti, una delle mie linee di lancio preferite su questo argomento molto, molto brevemente è che penso che l'esplosione di macchina a macchina e Internet of Things generale, comunicazione e sicurezza, il rischio che lo circonda, siamo al punto ora dove i governi non possono tenere il passo con il tasso di cambiamento. E infatti sappiamo che molte organizzazioni non riescono a tenere il passo con il tasso di cambiamento. In effetti, se lo avessi parafrasato, il tasso di cambiamento oggi è così grande che le organizzazioni devono correre per tenere il passo, ma devono correre in più gare. Non penso che la legge, e non credo che il governo in generale, a livello statale o federale, sia in grado di tenere il passo con il tasso di cambiamento.
Ora, il mio consiglio generale alle persone è una specie di atto e chiedo perdono in seguito. Ci sono stati molti esempi in passato. Saranno in grado di metterci al passo, ma penso che ora spetti davvero ai fornitori di business e tecnologia innovare in questo spazio e garantire che abbiamo familiarità con i rischi per la sicurezza o della privacy e dobbiamo affrontarli. Le banche in particolare, come hai detto, quando pensi a ciò che un'organizzazione bancaria ha tradizionalmente fatto con cose come il riciclaggio di denaro sporco e conosci il tuo cliente, la sfida AML / KYC, era che ogni tre o cinque anni provavamo e soddisfare la conformità.
Ora penso che debba essere integrato in ogni singola transazione. Sei sempre stato in grado di farlo a livello di offerta con pubblicità, azioni, obbligazioni e scambi azionari, penso che siamo al punto in cui le prestazioni che stai generando con la piattaforma Aerospike ci consentono ora di pensare a come possiamo portare privacy, come possiamo garantire la sicurezza in quella catena di decisioni immediata in tempo reale? E quindi la risposta è no, non credo che i governi stiano tenendo il passo. Penso che le aziende debbano tenere il passo e penso che dobbiamo agire subito e chiedere perdono in seguito.
Brian Bulkowski: Vorrei aggiungere anche un paio di punti. I ragazzi con cui ho a che fare, le aziende tecnologiche con cui ho a che fare, sono molto consapevoli di assicurarsi che siano dalla parte giusta della legge, e una buona parte della discussione è, è questa PII, posso usare questo, come sono Sto usando questo particolare blocco di dati? Qual è stata la sua provvidenza, e questa è una decisione o esperienza protetta? Come posso fare tutto questo? Quindi questa è la buona notizia. A volte mi chiedo della nostra discussione come società intorno a dove stiamo andando, e se anche la nostra discussione sulla società è al livello appropriato in termini di utilizzo delle nuove funzionalità dall'Io fino all'apprendimento automatico, che è l'unico modo per ordinare i volumi di dati che abbiamo. Ma la buona notizia è che i ragazzi con cui ho parlato sono davvero dalla parte giusta nel cercare di fare bene le decisioni legali che abbiamo preso.
Rebecca Jozwiak: Queste sono alcune risposte davvero buone da parte di entrambi, e sono totalmente d'accordo. Non penso che la sicurezza stia procedendo a un ritmo più rapido rispetto allo sviluppo della tecnologia, in particolare quando si tratta di Internet of Things, ma devo pensare che le persone stiano facendo del loro meglio e speriamo che ci arriveremo. È sempre un po 'difficile rimanere dieci passi avanti rispetto ai cyber ladri e ai cyber criminali, ma ci arriveremo.
Bene gente, siamo passati otto minuti in cima all'ora. Vorrei ringraziare i nostri ospiti Brian Bulkowski di Aerospike e Dez Blanchfield e Robin Bloor. Grazie mille. Puoi sempre trovare i nostri archivi su insideanalysis.com, SlideShare, YouTube, abbiamo un sacco di buoni webcast in arrivo gente, è stato un mese impegnativo. Il mese prossimo sarà un mese impegnativo, quindi rimanete sintonizzati e speriamo di vedervi la prossima volta. Grazie gente, ciao ciao.