ChatGPT ora può pronunciare le risposte alle domande ad alta voce quando richiesto. Secondo i primi resoconti degli utenti, la voce suona piacevole, umana ed espressiva, con un’intonazione e un ritmo di parola naturali.
Per iniziare con il controllo vocale, gli utenti utilizzano l’impostazione Nuove funzionalità nell’app iOS e scelgono Chat vocali e una delle cinque voci.
Per la nuova funzionalità audio, OpenAI ha collaborato con doppiatori professionisti per creare ogni voce. L’app utilizza anche Whisper, un sistema di riconoscimento vocale sviluppato da OpenAI, per convertire le parole pronunciate dall’utente in testo.
Sul desktop, ChatGPT non consente ancora chat dal vivo, ma piuttosto pronuncia le risposte ad alta voce su richiesta. Non c’è ancora il riconoscimento vocale sul PC.
ChatGPT può analizzare le immagini
ChatGPT sta inoltre ottenendo una nuova funzionalità che consente agli utenti di caricare immagini per l’analisi. Ciò consente a ChatGPT di classificare le immagini, rispondere a domande su di esse, rilevare incoerenze e altro ancora. Gli utenti possono disegnare riquadri su parti di immagini per focalizzare l’attenzione dell’intelligenza artificiale.
OpenAI ha introdotto la sua funzionalità di riconoscimento delle immagini nel marzo 2023, ma non l’ha ancora implementata.
Il produttore ne fornisce alcuni Campioni audio dall’uscita audio ChatGPT Disponibile online in modo che gli utenti possano avere una prima impressione delle funzionalità.