Gemini 2.0 Flash Thinking è il nuovo modello AI che indica chiaramente cosa e come "pensa".
Google ha lanciato un nuovo modello di intelligenza artificiale che mostra i "pensieri" e i "ragionamenti" che lo portano a dare risposte a domande complesse su problemi di fisica, matematica o codice.
Il nuovo modello che sfrutta anche le capacità in termini di velocità di Gemini 2.0 Flash è in status sperimentale, disponibile per gli sviluppatori in Google AI Studio e Vertex AI, denominato Gemini 2.0 Flash Thinking.
Come afferma Jeff Dean di Google DeepMind, Gemini 2.0 Flash Thinking è addestrato ad utilizzare i pensieri per rafforzare il suo ragionamento, come mostra nella demo condivisa su X.
Want to see Gemini 2.0 Flash Thinking in action? Check out this demo where the model solves a physics problem and explains its reasoning. pic.twitter.com/Nl0hYj7ZFS
— Jeff Dean (@JeffDean) December 19, 2024
Non esattamente come quello del nostro cervello, il ragionamento del modello di intelligenza artificiale va inteso come la capacità di esaminare la questione dividendo il problema in elementi più piccoli da analizzare separatamente, prima di fornire la soluzione più adeguata.
In un altro video pubblicato sempre via social, Logan Kilpatrick di Google presenta il nuovo modello in azione nella risoluzione di problemi contenenti sia elementi visivi che testuali, mentre mostra i suoi ragionamenti.
It’s still an early version, but check out how the model handles a challenging puzzle involving both visual and textual clues: (2/3) pic.twitter.com/JltHeK7Fo7
— Logan Kilpatrick (@OfficialLoganK) December 19, 2024
Proprio quando pensavi che fosse finita... ti presentiamo Gemini 2.0 Flash Thinking, un nuovo modello sperimentale che sblocca capacità di ragionamento più forti e mostra i suoi pensieri. I piani modello (con pensieri visibili), possono risolvere problemi complessi con velocità Flash e altro ancora, ha scritto Kilpatrick.
Breaking news from Chatbot Arena⚡🤔@GoogleDeepMind's Gemini-2.0-Flash-Thinking debuts as #1 across ALL categories!
— lmarena.ai (formerly lmsys.org) (@lmarena_ai) December 19, 2024
The leap from Gemini-2.0-Flash:
- Overall: #3 → #1
- Overall (Style Control): #4 → #1
- Math: #2 → #1
- Creative Writing: #2 → #1
- Hard Prompts: #1 → #1… https://t.co/lO1DiTiOOj pic.twitter.com/cq2MRMbWZ1
Anche se dai primi dati emersi sembra decisamente più potente, Gemini 2.0 Flash Thinking sarà probabilmente in competizione diretta con OpenAI o1, un altro LLM che "ragiona" prima di rispondere, uscito nei giorni scorsi dalla fase preview e adesso disponibile per i piani a pagamento di ChatGPT.