Sommario:
Definizione - Cosa significa sintesi vocale?
La sintesi vocale è una simulazione artificiale del linguaggio umano con un computer o un altro dispositivo. La controparte del riconoscimento vocale, la sintesi vocale, viene principalmente utilizzata per tradurre informazioni di testo in informazioni audio e in applicazioni come servizi vocali e applicazioni mobili. Oltre a questo, viene anche utilizzato nella tecnologia di assistenza per aiutare le persone con problemi di vista nella lettura del contenuto del testo.
Techopedia spiega la sintesi vocale
VODER di Homer Dudley, basato sul vocoder dei Bell Laboratories, è considerato il primo sintetizzatore vocale completamente funzionale. Il computer utilizzato nella sintesi vocale è noto come sintetizzatore vocale o computer vocale. La qualità del computer vocale è spesso giudicata dalla sua somiglianza con la voce umana. La maggior parte dei sistemi operativi per computer ha incorporato sintetizzatori vocali sin dai primi anni '90. Il parlato sintetizzato viene di solito generato con l'aiuto di concatenare parti del discorso registrato, che è contenuto in un database.
La fase iniziale della sintesi vocale è la pre-elaborazione, che elimina l'ambiguità che circonda il modo in cui la parola specifica deve essere letta e che include anche la gestione degli omografi. Nella fase successiva della sintesi vocale, il computer prende l'aiuto dei fonemi per convertire il testo in sequenza di suoni. L'ultima fase prevede l'uso di registrazioni umane o tecniche di generazione del suono di base per imitare il meccanismo della voce umana e leggere l'intero testo. Uno dei rami popolari della sintesi vocale è la sintesi vocale audiovisiva o sintesi vocale multimodale che utilizza un volto animato strettamente sincronizzato per integrare il discorso sintetizzato. La sintesi vocale multimodale incorpora anche funzionalità aggiuntive come segnali non verbali al discorso per aiutare a comunicare le parole dell'utente con maggiore precisione. Molti sistemi di sintesi vocale consentono agli utenti di scegliere il tipo di voce come voce maschile o femminile.
La maggior parte dei sistemi di sintesi vocale sono in grado di leggere testi e riprodurli in modo molto intelligente, sebbene a volte la voce possa essere noiosa. La sintesi vocale, tuttavia, deve ancora sviluppare la capacità di imitare completamente l'ampio spettro di intonazioni e cadenze umane.