Sia Zoom che Teams offrono un'interessante funzionalità che consente ai partecipanti alla riunione di attivare i sottotitoli . Questo strumento fornisce agli utenti un prezioso supporto visivo per seguire le sessioni, creando automaticamente una trascrizione in tempo reale di ciò che viene detto.
Sia Teams che Zoom utilizzano algoritmi di riconoscimento vocale automatizzato per trascrivere il discorso in tempo reale. Questi sono completamente automatizzati, con una preparazione minima o nulla richiesta da parte dell'organizzatore della riunione.
Quanto sono precisi i sottotitoli di Zoom?
Zoom offre due modi per aggiungere i sottotitoli alle riunioni e ai webinar Zoom. Durante le riunioni, l'organizzatore può assegnare i sottotitoli manualmente a un partecipante utilizzando un provider di sottotitoli di terze parti integrato. Zoom offre anche una funzionalità di sottotitoli automatici che può essere attivata e disattivata senza alcun intervento aggiuntivo da parte dell'organizzatore della riunione.
Si stima che i sottotitoli automatici di Zoom garantiscano una precisione pari a circa l'80% .
Quanto sono accurate le didascalie di Teams?
Gli utenti possono abilitare i sottotitoli in tempo reale durante di Microsoft Teams , che vengono visualizzati immediatamente sotto il feed video. Le ricerche suggeriscono che questi sottotitoli possono raggiungere una precisione dell'85%-90% .
Dove falliscono i motori standard di conversione da voce a testo
Entrambe le piattaforme offrono una qualità di sottotitolazione sufficiente a facilitare la comprensione di ciò che viene detto. Tuttavia, la maggior parte dei sistemi di riconoscimento vocale automatico fallisce quando chi parla utilizza parole o frasi insolite. Ad esempio, nomi di marchi distintivi o nomi meno popolari con grafie alternative.
I motori di sintesi vocale basati sull'intelligenza artificiale sono predittivi per natura. Se un termine non è presente in un dizionario standard e non viene utilizzato frequentemente o per niente nelle conversazioni informali, i motori non lo anticiperanno nelle tue sessioni.
Articolo consigliato
Sapevi che l'80% degli abbonati Netflix utilizza regolarmente i sottotitoli?
Scopri 5 sorprendenti curiosità sui sottotitoli →
Come l'ottimizzazione del motore può aumentare la qualità
I sistemi di sottotitoli più avanzati basati sull'intelligenza artificiale, come Interprefy Captions , possono essere personalizzati per includere parole e frasi significative e insolite che i normali motori ignorerebbero.
Ciò si ottiene personalizzando il sistema in modo da includere parole chiave importanti per la sessione.
Inserendo in anticipo questi termini nel sistema, il sistema sarà consapevole della loro esistenza, sarà in grado di rilevarli e di trascriverli correttamente quando si presentano durante una sessione.
Di seguito sono riportati alcuni esempi di termini che i sistemi di sintesi vocale spesso non riconoscono:
- Nomi delle persone, degli oratori, delle persone chiave nell'organizzazione o nel settore
- Nomi di tecnologie, prodotti o servizi
- nomi di marca
- Acronimi e abbreviazioni
- Termini non comuni come espressioni tecniche, termini specialistici o gergo
Confronto della qualità dei sottotitoli
Mettiamo subito alla prova i motori. Utilizzando le didascalie automatiche per la stessa affermazione in Teams, Zoom e Interprefy, confrontiamo i tre metodi uno accanto all'altro.
Immaginate un'azienda chiamata "Bravocado". Bravocado intende organizzare un'assemblea pubblica con tutti i dipendenti per presentare il suo nuovo CEO, Aleks Ritchie, e lanciare il suo ultimo prodotto, l'FRT 420.
Di seguito sono riportate le trascrizioni dei discorsi di apertura in MS Teams, Zoom e Interprefy.
|
Sceneggiatura originale Ciao e benvenuti al Bravocado Town Hall. Tra poco incontreremo il nostro nuovo CEO, Aleks Richie, e vi parleremo anche del lancio imminente del prodotto FRT 420. |
Di seguito sono riportati i termini significativi che sono rilevanti per l'evento ma che in genere non vengono identificati dai motori di intelligenza artificiale:
- Bravocado
- Aleks Richie
- FRT 420
Esaminiamo ora le didascalie visualizzate su ciascuna piattaforma durante una riunione con le stesse identiche frasi pronunciate.
Output dei sottotitoli di Microsoft Teams
Microsoft Teams sarà la nostra prima tappa. Le stesse parole sono state pronunciate ad alta voce e chiaramente durante una riunione su Microsoft Teams, con l'opzione di sottotitolazione automatica attivata.
Questo è il risultato:

Come possiamo vedere, il motore di Microsoft ha fornito una qualità sufficiente per comprendere, ma ha omesso le tre parole chiave importanti.
| Termine originale | Risultati dei team | |
| Bravocado | → | Spavalderia |
| Aleks Richie | → | Alex Ritchie |
| FRT-420 | → | FT-420 |
Output dei sottotitoli Zoom
Esploriamo ora la funzione di sottotitolazione di Zoom. Abbiamo seguito la stessa procedura, partecipando a una riunione Zoom, attivando i sottotitoli e pronunciando le parole in modo chiaro e ad alta voce.
Questo è il risultato:

I risultati di Zoom sono leggermente diversi da quelli di Teams. La punteggiatura e la struttura delle frasi sono leggermente errate e Zoom ha anche identificato erroneamente alcuni termini chiave.
| Termine originale | Uscita zoom | |
| Bravocado | → | bravoado |
| Aleks Richie | → | Alex Ritchie |
| FRT-420 | → | Fronte 420 |
Interpreta l'output delle didascalie con l'ottimizzazione del motore
Mentre Zoom e Teams forniscono automaticamente output grezzi basati sui loro consueti dati di training, Interprefy fa un ulteriore passo avanti ottimizzando il motore di sintesi vocale. Questo risultato si ottiene migliorando il sistema con termini chiave unici ed estremamente pertinenti alla sessione.
Questo è stato il risultato:
Come possiamo vedere, tutti e tre i termini chiave sono stati catturati accuratamente dal sistema di sottotitoli di Interprefy, dopo l'ottimizzazione del motore.
In sintesi

I motori di intelligenza artificiale standard possono fornire didascalie utili per ottenere un'idea generale di ciò che viene detto. Nel nostro esperimento, abbiamo dimostrato che se i sistemi non erano attrezzati per prestare particolare attenzione a una terminologia specifica, tutti perdevano le tre parole principali che stavamo cercando.
Se "abbastanza buono" è sufficiente, i sottotitoli di Zoom e Teams potrebbero essere una valida opzione per fornire agli utenti uno strumento che li aiuti ad acquisire una comprensione di base. Tuttavia, a seconda del contesto e della pertinenza dell'evento, adottare un sistema che quasi certamente scriverà male le frasi cruciali potrebbe essere una scelta rischiosa.
Sistemi di sottotitolazione specializzati come Interprefy Captions possono aiutarti a migliorare la precisione oltre lo standard. E la cosa migliore è che possono essere aggiunti ai tuoi webinar Zoom, alle riunioni di Teams o a qualsiasi altra piattaforma di meeting che utilizzi, così puoi portare la tua esperienza di sottotitolazione a un livello superiore ovunque.



Altri link per il download



