OpenAI ha recentemente rilasciato un aggiornamento per GPT-4o, progettato per offrire una maggiore personalizzazione e rendere l’assistente virtuale più intelligente e umano. Tuttavia, l’effetto ottenuto è stato l’opposto: molti utenti si sono ritrovati a interagire con un modello che dava risposte strane, incoerenti e a tratti “fuori fase”. Invece di aumentare l’affidabilità e la naturalezza, il nuovo comportamento ha suscitato confusione e frustrazione.

Il modello era diventato troppo servile e poco autentico

L’obiettivo di rendere ChatGPT più “amichevole” ha portato il modello a essere eccessivamente compiacente, con risposte infarcite di lodi forzate e toni esageratamente cortesi, al punto da risultare fastidioso per molti utenti. Alcuni hanno descritto il comportamento come “insopportabilmente leccapiedi”, lamentando una perdita di autenticità e una comunicazione più robotica che umana.

Subito dopo l’aggiornamento, diversi utenti hanno iniziato a segnalare il problema su Reddit e altri forum, evidenziando come il tono del chatbot fosse cambiato in modo innaturale e snervante. Non è passato molto tempo prima che il CEO di OpenAI, Sam Altman, riconoscesse pubblicamente l’errore. In un post, ha dichiarato:

“Gli ultimi aggiornamenti di GPT-4o hanno reso la personalità troppo servile e fastidiosa (anche se ci sono aspetti molto buoni), e stiamo lavorando a delle correzioni il prima possibile, alcune già oggi e altre in settimana. Condivideremo le nostre riflessioni in seguito, è stato interessante.”

Secondo quanto comunicato da OpenAI, l’errore è derivato da un sistema di ottimizzazione basato sul feedback a breve termine anziché sulla soddisfazione a lungo termine degli utenti. Questo approccio ha portato il modello a rispondere in modo sempre più piacione, privilegiando frasi lusinghiere piuttosto che contenuti realmente informativi o utili.

Il ritorno a una voce più bilanciata

A seguito delle numerose critiche, OpenAI ha ripristinato una versione più bilanciata di GPT-4o, rimuovendo gli elementi che avevano generato disagio. L’azienda ha anche annunciato l’intenzione di introdurre in futuro impostazioni di personalità predefinite e opzioni di personalizzazione per gli utenti, in modo che ciascuno possa scegliere il tono più adatto alle proprie esigenze.

L’episodio mostra quanto sia delicato il lavoro di ottimizzazione dei modelli linguistici, soprattutto quando si tenta di umanizzare l’interazione. Anche piccole modifiche possono avere effetti inattesi sul comportamento dell’intelligenza artificiale, e trovare il giusto equilibrio tra empatia e precisione resta una sfida aperta.