Casa Software Tecnologia di riconoscimento vocale: utile o dolorosa?

Tecnologia di riconoscimento vocale: utile o dolorosa?

Sommario:

Anonim

Hai mai chiamato un'azienda per chiedere aiuto o pagare il conto, solo per essere accolto da una piacevole voce registrata che vuole avere una conversazione con te - ma non riesci a capire la metà di quello che stai dicendo? O forse possiedi un iPhone, e mentre Siri per la prima volta sembrava un buon alleato, ti sei reso conto che a volte (OK, siamo sinceri, spesso) semplicemente non lo capisce? La tecnologia di riconoscimento vocale (VRT), nota anche come sintesi vocale, cade in una trappola comune: ha il potenziale per essere incredibilmente bella (e ragazzo, stiamo facendo il tifo per essa), ma più spesso, è un digrignare i denti esercitarsi nella frustrazione.


Una volta un'idea appartenuta al regno della fantascienza, il riconoscimento vocale è cresciuto dalla sua infanzia negli anni '50, quando il sistema Audrey di Bell Laboratories è stato progettato per riconoscere le cifre pronunciate in una sola voce, alla moderna rete di elettronica di conversazione con cui ora interagiamo con su base giornaliera - con risultati contrastanti.

Per parlare a un essere umano, premere 0

Molte delle aziende di oggi utilizzano sistemi chiamati Interactive Voice Response (IVR) per gestire le chiamate al servizio clienti. L'uso più comune è per i menu a navigazione vocale, ma alcune aziende utilizzano sistemi IVR che possono accedere alle informazioni sull'account del cliente e rispondere a domande minori. Il software Menu IVR di solito ha un vocabolario limitato, che può essere limitato a "sì", "no" e numeri. Sistemi più complicati sono in grado di riconoscere parole e frasi specifiche dell'azienda.


Questi sistemi stanno diventando più popolari - almeno per le aziende - per un semplice motivo: sono convenienti. Secondo un rapporto del 2010 del Wall Street Journal, una tipica chiamata del cliente che raggiunge un agente costa tra $ 3 e $ 9, mentre una chiamata gestita attraverso un sistema automatizzato costa solo dai cinque ai sette centesimi. E, naturalmente, i programmi per computer non si stancano, si ammalano o si frustrano con i clienti (anche se i clienti certamente si frustrano con loro!).


Fortunatamente, questo non significa sempre che l'IVR porti via i lavori alle persone - o almeno che tutte le persone stiano scomparendo dai call center. Questi helper ad attivazione vocale consentono ai rappresentanti del servizio clienti umano di essere più produttivi indirizzando le chiamate e rispondendo a semplici domande.


Naturalmente per gli utenti umani che interagiscono con queste tecnologie, non è sempre una navigazione fluida. La tecnologia sta contribuendo a migliorare i problemi comuni nella tecnologia IVR, come i problemi con gli accenti, ma il licenziamento dei sistemi automatizzati è ancora un tema comune online. Dai un'occhiata a questa scenetta comica su un ascensore dotato di riconoscimento vocale, che evidenzia la frustrazione che possono causare malfunzionamenti nei sistemi IVR.

App per telefoni personali: Siri, Google Now

Molte persone hanno familiarità con il riconoscimento vocale per smartphone. Mentre la maggior parte degli ultimi modelli di telefoni sono dotati di VR, la loro popolarità - e la loro notorietà - è aumentata quando Apple ha introdotto Siri, l'assistente personale leggermente sarcastico e ad attivazione vocale per iPhone 4S nel 2011. Google ha presto creato un concorrente diretto: Google Ora per Android Jelly Bean OS. Entrambi i sistemi presentano voci femminili e sofisticate funzioni di riconoscimento che consentono agli utenti di "parlare" con i loro telefoni utilizzando un linguaggio informale.


Ma mentre questi sistemi sono considerevolmente più sofisticati e funzionali dei loro predecessori, mostrano anche che la tecnologia ha ancora molta strada da fare. Le battute sul fallimento di Siri sono diventate un popolare meme su Internet. Un uomo ha persino citato in giudizio Apple per false pubblicità riguardanti le capacità di Siri.


Forse è per questo che mentre Apple ha creato Siri per essere avanzato e informativo, il software VR è anche un po 'sfacciato. Ad esempio, se nel film del 1968 "2001: Odissea nello spazio" parli di una delle linee di tecnologia dell'intelligence più famigerate della storia del cinema, "apri le porte della baia", Siri risponderà con la linea di risposta del film " Mi dispiace (il tuo nome), temo di non poterlo fare ", o più sarcastico", apparentemente noi agenti dell'intelligence non lo faremo mai.


Chiamarti per nome è solo una delle funzioni che cerca di rendere Siri più facile da amare e un po 'più umano. L'assistente VR può seguire i comandi vocali per effettuare chiamate, prendere dettature e inviare messaggi, eseguire ricerche su Internet per informazioni, trovare negozi nelle vicinanze, fornire indicazioni stradali e altro, il tutto senza la necessità di toccare nulla. Le risposte vengono simultaneamente pronunciate dal telefono e visualizzate sullo schermo.


Google Now, la parte VR della piattaforma Android Jelly Bean, è molto simile a Siri. Il sistema offre le stesse ampie capacità di riconoscimento traducendo il parlato casuale in comandi che consentono agli utenti di effettuare chiamate, inviare messaggi, eseguire ricerche, eseguire calcoli e conversioni, acquisire definizioni di parole, impostare allarmi, riprodurre brani musicali e ottenere mappe e indicazioni stradali.


Con gli assistenti vocali personali come Siri e Google Now, i vantaggi sono evidenti. Tutto, dalle chiamate ai messaggi di testo, alla ricerca e all'intrattenimento è più semplice e veloce. Dì solo quello che vuoi e (la maggior parte delle volte) l'app VR lo prende per te. La tecnologia pratica della realtà virtuale è particolarmente utile durante la guida. E mentre molte persone hanno denunciato i difetti di Siri e gli scrittori hanno sostenuto che la capacità di Google Now di gestire essenzialmente la vita degli utenti è sia un po 'inquietante che un po' offensiva, la maggior parte delle persone ritiene ancora che queste tecnologie futuristiche siano piuttosto interessanti.


Naturalmente, le app per telefono personale come Siri e Google Now sono tutt'altro che perfette, anche se mostrano dove questa tecnologia potrebbe essere diretta in futuro. Ciò significa che anche quando Siri presenta una risposta sbagliata, è probabile che ridiamo e la perdoniamo, sapendo che la prossima versione sarà molto migliore.

Dove VR cade piatto

Se hai mai incontrato un IVR quando hai chiamato un'azienda, potresti aver notato alcuni ostacoli alla comunicazione. Alcuni programmi usano una voce di sintesi vocale robotizzata che pronuncia male le parole e rende le cose difficili da capire. Altri hanno problemi di sensibilità che fanno sì che il software non sia in grado di elaborare ciò che stai dicendo se sei troppo rumoroso, troppo debole o non enunciato con attenzione.


Inoltre, molte persone continuano a non sentirsi a proprio agio a parlare con una macchina. Se esegui alcune ricerche su IVR, incontrerai elenchi che le persone hanno messo insieme di modi per bypassare i sistemi IVR e arrivare a una "persona reale". Queste soluzioni vanno da "continuare a premere 0 per un operatore" a "imprecare contro la macchina fino a quando non recupera un essere umano". Di conseguenza, gran parte del recente sviluppo dei sistemi IVR ha ruotato attorno a renderli più appetibili per l'uomo; rendendo le voci più simpatiche e meno robotiche, rendendo il sistema più facile da navigare e facendo sapere ai chiamanti quanto tempo impiegherà tutto dall'inizio alla fine. Ciò suggerisce che la tecnologia migliore è solo metà della battaglia qui; l'altra metà sta convincendo gli utenti a parlare con una macchina.

Cosa riserva il futuro

Nonostante queste sfide, la tecnologia di riconoscimento vocale migliora continuamente. Applicazioni come Siri e Google Now - difetti e tutti - sono ancora straordinariamente impressionanti nelle loro prestazioni e diverse aziende stanno espandendo le funzionalità VR ad altre applicazioni.


Ad esempio, Nuance, i creatori del software di sintesi vocale Dragon NaturallySpeaking, ha già sviluppato controlli vocali per televisori e automobili e le versioni di questa tecnologia sono incorporate in alcuni televisori Samsung e nei sistemi di intrattenimento SYNC utilizzati in alcuni veicoli Ford.


E poiché Google e Apple continuano a trovare nuovi usi per le loro tecnologie di riconoscimento vocale, è probabile che parleremo sempre più con tutti i tipi di macchine di tutti i giorni, dai nostri televisori ai nostri tostapane. E, ancora una volta, sembra che la fantascienza fosse giusta. Dovremo solo sperare che quegli abili scrittori si sbagliassero su una cosa. Se queste macchine stanno subentrando, potresti essere nei guai la prossima volta che chiedi a Siri di "aprire le porte dell'alloggiamento del pod".

Tecnologia di riconoscimento vocale: utile o dolorosa?