Il nuovo sistema multimodale alla base di ChatGPT è adesso disponibile.
OpenAI ha annunciato il suo ultimo modello di intelligenza artificiale, GPT-4. Dopo una grande risposta al lancio di ChatGPT lo scorso anno, le aspettative sono alte per il nuovo sistema che può accettare sia input di testo che di immagine, restituendo anche musica o video.
Il nuovo modello è disponibile su ChatGPT Plus e come API per gli sviluppatori, con Microsoft che lo annuncerà nelle prossime ore integrato in Bing Chat.
Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023
GPT-4 è un modello multimodale (che accetta input di immagine e testo, emettendo - di base - output di testo) che, sebbene peggiore degli esseri umani in molti scenari reali, mostra prestazioni a livello umano su vari benchmark professionali e accademici. Per esempio, supera un esame simulato da avvocato con un punteggio intorno al 10% superiore dei candidati; in contrasto, il punteggio di GPT-3.5 era intorno al 10% inferiore.
Generative Pre-trained Transformer 4 (GPT-4) si stima che abbia 100 trilioni di parametri, un'enormità se paragonati ai 175 miliardi di GPT-3 e ai circa 86 miliardi del cervello umano.
OpenAI ha trascorso 6 mesi iterativamente allineando GPT-4 utilizzando lezioni dal suo programma di test avversari e da ChatGPT, ottenendo i suoi migliori risultati (sebbene lontani dalla perfezione) su fattualità, guidabilità e rifiuto di uscire dai guardrail. Come detto, il modello è disponibile oggi tramite l'API di OpenAI e in ChatGPT Plus, l'abbonamento premium di OpenAI per ChatGPT.
ChatGPT è una piattaforma che permette agli utenti di interagire con GPT-4 tramite una semplice interfaccia web. Gli utenti possono scegliere tra diversi stili e toni di conversazione, come amichevole, professionale o divertente. Possono anche inviare immagini al modello e ricevere descrizioni o commenti generati automaticamente.
Il vantaggio di GPT-4 rispetto a GPT-3.5 è la sua capacità di gestire compiti più complessi e sfumati rispetto al precedente modello. Per capire la differenza tra i due modelli, OpenAI ha testato su una varietà di benchmark, tra cui simulare esami che erano originariamente progettati per gli esseri umani. Il modello non ha ricevuto alcun addestramento specifico per questi esami.
Il lancio di GPT-4 rappresenta un passo importante nella ricerca sull'intelligenza artificiale e sul deep learning. OpenAI si propone come obiettivo finale la creazione di un'intelligenza artificiale generale (AGI), ovvero un sistema capace di apprendere qualsiasi compito umano o sovrumano. Tuttavia, la società è anche consapevole dei potenziali rischi etici e sociali legati allo sviluppo dell'IA e si impegna a garantire la sicurezza e l'accessibilità dei suoi modelli.