Posizione: Casa > tecnologia >

Qual è il riconoscimento vocale?

  

riconoscimento vocale può fare riferimento a uno dei due tipi di computer science: identificazione vocale forensi o speech-to-capacità di testo. In questo articolo si affronta la definizione di quest'ultimo.

riconoscimento vocale, o il riconoscimento vocale, in questo caso, è una tecnologia informatica che utilizza ingresso audio per l'inserimento dei dati, piuttosto che una tastiera. Parlando in un microfono, per esempio, produce lo stesso risultato digitando le parole manualmente con una tastiera. In parole povere, software di riconoscimento vocale è stato progettato con un database interno di parole o frasi riconoscibili. Il programma corrisponde alla firma di audio del discorso con le voci corrispondenti nel database.

Anche se trasformare il parlato in testo potrebbe sembrare facile, è un compito estremamente difficile. Il problema risiede nella serie pressoché infinita di modelli di intervento individuali e di accenti, aggravata dalla naturale tendenza umana a correre insieme le parole.

Un esempio delle difficoltà intrinseche del software di riconoscimento vocale viene visualizzato su una T-shirt creata dai ricercatori Apple. La camicia si legge, "mi ha aiutato Apple relitto una bella spiaggia. "Quando si parla ad alta voce, che suona come, ho aiutato Apple riconoscimento vocale.

vari modelli di software di riconoscimento vocale sono utilizzati per una vasta gamma di applicazioni, dalla dettatura personale commerciale automatizzati di chiamata routing, da aiutare le persone disabili a sport e di eventi notizie sottotitoli. Ogni modello comporta in modo diverso e ha le proprie capacità e dei confini.

programmi di riconoscimento vocale che richiedono all'utente di "addestrare" il software a riconoscere la loro particolare stilizzato modelli di intervento sono chiamati speaker dipendenti . Gli individui utilizzano comunemente questi tipi di programmi a casa o in ufficio. E-mail, appunti, lettere, dati e testi possono essere inserite dal parlando in un microfono.

Alcuni sistemi di riconoscimento vocale, chiamata vocale discreti sistemi, richiedono all'utente di parlare chiaramente e lentamente e per separare le parole. parlato continuo sono progettati per capire un modo più naturale di parlare.

discreta voce di sistemi di riconoscimento vocale sono ampiamente utilizzati per il routing del servizio clienti. Il sistema è Speaker Independent , ma comprende solo una piccola piscina di parole o frasi. Il chiamante viene data una scelta di rispondere a una domanda, di solito con "sì" o "no". Dopo aver ricevuto una risposta, il sistema si intensifica il chiamante al livello successivo. Se il chiamante risponde con una risposta unica, la risposta automatica è di solito, "Mi dispiace, non ho capito, per favore riprova", con una ripetizione della domanda e le risposte disponibili. Questo tipo di riconoscimento vocale è indicato anche come Recognition Grammar vincolato.

Parlato continuo è una forma più sofisticata di software di riconoscimento vocale, in cui il chiamante può parlare in modo naturale per spiegare un problema o richiesta di un servizio. Questo programma è stato progettato per individuare le parole chiave o frasi e fare una statistica migliore indovinare che cosa vuole il cliente. Parlando chiaramente aiuti di riconoscimento vocale per identificare la necessità. Questo tipo di sistema ha un database molto più intensa rispetto ai sistemi discorso discreta ed è indicato anche come riconoscimento del linguaggio naturale.

Automatic Speech Recognition (ASR) è un modello di riconoscimento vocale progettati per la dettatura. Questo software si distingue dai modelli precedenti in quanto non si sforza di capire cosa viene detto, solo per identificare le parole pronunciate. Dal momento che molte parole nel suono della lingua inglese sia, gli errori sono fatti facilmente. Tuttavia, le grandi società come Microsoft sta investendo in riconoscimento vocale, e la previsione proprio Bill Gates 'ha ASR comprensione del parlato continuo, entro l'anno 2011. Software ASR si trova spesso su registratori digitali.

operatori dominanti nel software di riconoscimento vocale sono stati ScanSoft e Nuance, con l'ex società incorporante quest'ultimo. Gli attori minori comprendono Fonix Speech, Aculab e Verbio, tra gli altri, con grandi aziende come IBM e il già citato Microsoft ha inoltre investito in questa tecnologia. Anche se molti si sentono ancora più difficoltà a formare il software e correggere gli errori piuttosto che semplicemente utilizzare una tastiera, un tempo a venire, quando il software di riconoscimento vocale sarà probabilmente colmare tale divario. Aumentare le tastiere con la capacità di discriminare l'uso discorso probabilmente diventato un luogo comune.

software di riconoscimento vocale sta guadagnando popolarità come diventa sempre più sofisticati. E 'particolarmente utile negli affari, dove si può sostituire un operatore live a imbuto chiamate, diffondere le informazioni, gli ordini e svolgere altre funzioni molto utili. Tuttavia, è anche guadagnando i favori come un'applicazione desktop, aiutata da un software rinomati come ScanSoft, DragonNaturallySpeaking e IBM ViaVoice .

----------------------------------
----------------------------------