Modello LLM più piccolo, economico ed efficiente ma ugualmente con punteggi elevati nei benchmark.
Dopo l'annuncio di GPT-4o, risalente allo scorso maggio, OpenAI presenta e lancia da subito il nuovo GPT-4o mini, LLM più piccolo ma ugualmente potente, a beneficio di utenti e sviluppatori. GPT-4o mini sostituisce GPT-3.5 in ChatGPT per tutti gli utenti, anche free, e nei servizi Microsoft che utilizzano Copilot.
GPT-4o mini garantisce efficienza massima per i costi, con prezzi di 15 centesimi per milione di token in input e 60 centesimi per milione di token in output (circa 2500 pagine), per una riduzione della spesa del 60%. Scendono i costi ma non i punteggi, capaci di arrivare all'82% su MMLU, superiore a concorrenti come Gemini Flash di Google.
Attività di ragionamento: GPT-4o mini è migliore di altri piccoli modelli nelle attività di ragionamento che coinvolgono sia testo che visione, ottenendo un punteggio dell'82,0% su MMLU, un benchmark di ragionamento e intelligenza testuale, rispetto al 77,9% di Gemini Flash e al 73,8% di Claude Haiku.
Competenza in matematica e codifica: GPT-4o mini eccelle nel ragionamento matematico e nelle attività di codifica, superando i precedenti modelli di piccole dimensioni sul mercato. Su MGSM, che misura il ragionamento matematico, GPT-4o mini ha ottenuto l'87,0%, rispetto al 75,5% di Gemini Flash e al 71,7% di Claude Haiku. GPT-4o mini ha ottenuto l'87,2% su HumanEval, che misura le prestazioni di codifica, rispetto al 71,5% di Gemini Flash e al 75,9% di Claude Haiku.
Ragionamento multimodale: GPT-4o mini mostra ottime prestazioni anche nel MMMU, una valutazione del ragionamento multimodale, ottenendo un punteggio del 59,4% rispetto al 56,1% di Gemini Flash e al 50,2% di Claude Haiku.
Per gli sviluppatori e per gli utenti ChatGPT Enterprise, la messa a punto e la disponibilità di GPT-4o richiede ancora qualche giorno. Per gli utenti ChatGPT Free, Plus e Team il cambiamento è già attivo.
Ulteriori dettagli qui.