OpenAI habiti përdoruesit kur demonstroi një modalitet zëri të përditësuar për versionin më të avancuar të ChatGPT në fillim të këtij viti.

Ndryshe nga Alexa ose Siri, modaliteti i avancuar i zërit ChatGPT tingëllon jashtëzakonisht i gjallë. Ai përgjigjet në kohë reale, mund të përshtatet kur të ndërpritet, mund të bëjë zhurma të qeshura kur një përdorues bën një shaka dhe mund të gjykojë gjendjen emocionale të një folësi bazuar në tonin e zërit të tij.

Modaliteti  i avancuar i zërit – i cili funksionon me versionin më të fuqishëm të chatbot, ChatGPT-4o – do të fillojë të shpërndahet për përdoruesit me pagesë. Modaliteti i avancuar i zërit do të fillojë të shpërndahet për një grup të vogël abonentësh në modalitetin "Plus" të aplikacionit, me synimin për ta bërë atë të disponueshëm për të gjithë përdoruesit e Plus në vjeshtë.

ChatGPT ka tashmë një modalitet zëri më pak të sofistikuar. Por shfaqja e një modaliteti më të avancuar të zërit mund të shënojë një pikë kthese të madhe për OpenAI, duke e transformuar atë që ishte tashmë një chatbot i rëndësishëm i AI në diçka më të ngjashme me një asistent virtual, personal që përdoruesit mund të angazhohen në biseda natyrore dhe të folura në të njëjtën mënyrë. se do të bisedonin me një mik. Lehtësia e bisedës me modalitetin e avancuar të zërit të ChatGPT mund t'i inkurajojë përdoruesit të angazhohen më shpesh me mjetin dhe të përbëjë një sfidë për asistentët virtualë në detyrë si Apple dhe Amazon.

Por prezantimi i një modaliteti më të avancuar të zërit për ChatGPT vjen gjithashtu me pyetje të mëdha: A do ta kuptojë ky asistent virtual me besueshmëri se çfarë po përpiqen të thonë përdoruesit, edhe nëse kanë dallime në të folur? Dhe a do të jenë më të prirur përdoruesit t'i besojnë verbërisht një asistenti të inteligjencës artificiale me tingull njerëzor, edhe kur i bën gjërat keq?

Kompania tha se muajt e fundit ka provuar aftësitë e zërit të modelit të AI me më shumë se 100 testues që kërkojnë të identifikojnë dobësitë e mundshme, "të cilët kolektivisht flasin gjithsej 45 gjuhë të ndryshme dhe përfaqësojnë 29 gjeografi të ndryshme", sipas një deklarate të së martës.

Ndër masat e sigurisë, kompania tha se modaliteti i zërit nuk do të jetë në gjendje të përdorë asnjë zë përtej katër, opsione të paracaktuara që krijoi në bashkëpunim me aktorët e zërit - për të shmangur imitimin - dhe gjithashtu do të bllokojë disa kërkesa që synojnë të gjenerojnë muzikë ose audio tjetër me të drejtë autori. OpenAI thotë se mjeti do të ketë gjithashtu të njëjtat mbrojtje si modaliteti i tekstit ChatGPT për ta parandaluar atë të gjenerojë përmbajtje të paligjshme ose "të dëmshme".