Capacità avanzate da agente a disposizione di tutti. Si parte dal modello più leggero Gemini 2.0 Flash.
Come da rumor neanche troppo recenti, Google ha annunciato oggi il lancio ufficiale di Gemini 2.0, nuova famiglia di modelli AI avanzati a disposizione di tutti coloro che desiderano entrare nell'era agenziale. Con la presentazione di Gemini 2.0, è disponibile da subito il modello più leggero, Gemini 2.0 Flash.
Da Sundar Pichai, CEO di Google e Alphabet:
Oggi siamo felici di lanciare Gemini 2.0, la nostra tecnologia più evoluta, pronta per un’era di AI ancora più versatile. Con output nativi per immagini e audio e strumenti integrati, Gemini 2.0 apre la strada verso l’assistente universale del futuro.
Gemini 2.0 è ora nelle mani di sviluppatori e tester fidati, mentre lavoriamo per integrarla rapidamente nei nostri prodotti, a partire da Gemini e dalla Ricerca Google. A partire da oggi, tutti gli utenti di Gemini potranno accedere al modello sperimentale Gemini 2.0 Flash. Inoltre, presentiamo Deep Research, una funzionalità progettata per aiutarti nelle ricerche complesse, sfruttando capacità di ragionamento avanzate e contesti lunghi per produrre report dettagliati per te. Questa funzionalità è ora attiva in Gemini Advanced.
Nessun prodotto è stato trasformato dall’AI più della Ricerca. AI Overview ora raggiunge 1 miliardo di persone, consentendo di porre domande completamente nuove — diventando in poco tempo una delle funzionalità della Ricerca più popolari di sempre. Come prossimo passo, porteremo le capacità di ragionamento avanzato di Gemini 2.0 in AI Overview per affrontare argomenti più complessi e domande multi-step, incluse equazioni matematiche avanzate, query multimodali e scrittura di codice. Abbiamo iniziato test limitati questa settimana e prevediamo un’implementazione più ampia all’inizio del prossimo anno. Continueremo inoltre a portare AI Overview in più paesi e lingue nel corso dell’anno successivo.
I progressi di Gemini 2.0 si basano su oltre un decennio di investimenti nel nostro esclusivo approccio full-stack all’innovazione nell’AI. Il modello è supportato da hardware su misura come Trillium, la nostra sesta generazione di TPU. Queste TPU hanno gestito interamente l’addestramento e l’inferenza di Gemini 2.0. A partire da oggi, Trillium è disponibile per tutti i clienti, permettendo loro di sfruttarne il potenziale.
Gemini 1.0 ci ha aiutato a organizzare e comprendere le informazioni, ma con Gemini 2.0 l’obiettivo è trasformarle in strumenti più utili. Non vedo l’ora di vedere il futuro che ci aspetta.
Il primo modello della famiglia Gemini 2.0 è Gemini 2.0 Flash, proposto in versione sperimentale.
Gemini 2.0 Flash si basa sul successo di 1.5 Flash, il nostro modello più popolare per gli sviluppatori, con prestazioni migliorate e tempi di risposta altrettanto rapidi. Nello specifico, 2.0 Flash supera addirittura 1.5 Pro nei principali benchmark, con una velocità raddoppiata. Flash 2.0 è dotato anche di nuove funzionalità. Oltre a supportare input multimodali come immagini, video e audio, Flash 2.0 adesso supporta output multimodali come immagini generate in modo nativo mescolate con testo e audio multilingue di sintesi vocale (TTS) orientabile. Può inoltre richiamare in modo nativo strumenti come la Ricerca Google, l'esecuzione di codice e funzioni di terze parti definite dall'utente.
Gemini 2.0 Flash è ora disponibile come modello sperimentale per gli sviluppatori tramite l'API Gemini in Google AI Studio e Vertex AI con input multimodale, output testuale e sintesi vocale e generazione nativa di immagini disponibile per i partner con accesso in anteprima. La disponibilità generale seguirà a gennaio, insieme ad altre dimensioni del modello.
A partire da oggi, tutti gli utenti Gemini a livello globale possono usufruire di una versione ottimizzata della chat di 2.0 Flash Experimental dal menu a tendina dei modelli su desktop e browser mobile, presto disponibile nell'app mobile. Gemini 2.0 sarà esteso ad altri prodotti Google all'inizio del 2025.
Con gli annunci odierni, Google ha presentato anche ulteriori modelli sperimentali AI:
Project Astra
Un’assistente AI universale. I miglioramenti dell'ultima versione realizzata con Gemini 2.0 includono:
- Dialoghi migliori: Project Astra è ora in grado di conversare in più lingue e in lingue miste, con una migliore comprensione degli accenti e delle parole non comuni.
- Utilizzo di nuovi strumenti: Con Gemini 2.0, Project Astra può utilizzare la Ricerca Google, Google Lens e Google Maps, diventando più utile come assistente nella vita quotidiana.
- Memoria migliore: Abbiamo migliorato la capacità di Project Astra di ricordare le cose, pur lasciando il controllo all'utente. Ora ha fino a 10 minuti di memoria in sessione e può ricordare un numero maggiore di conversazioni avute in passato, in modo da essere più personalizzato per l'utente.
- Latenza migliorata: Grazie alle nuove funzionalità di streaming e alla comprensione audio nativa, l'agente è in grado di comprendere il linguaggio con una latenza pari a quella di una conversazione umana.
Project Mariner
Un prototipo avanzato di ricerca costruito con Gemini 2.0, getta le basi per nuove modalità di interazione tra persone e agenti, partendo direttamente dal browser. Con un'estensione sperimentale per Chrome, è capace di leggere e interpretare ogni elemento sullo schermo, dalle immagini ai moduli, per aiutarti a portare a termine le tue attività.
Misurato rispetto al benchmark WebVoyager e pensato per valutare la capacità degli agenti di completare attività web reali, Project Mariner ha raggiunto un eccezionale 83,5% in modalità a singolo agente.
Jules
Con Jules, stiamo esplorando come gli agenti basati sull'AI possano diventare alleati preziosi per gli sviluppatori. Jules è un agente sperimentale che si integra direttamente nel flusso di lavoro su GitHub. Può prendere in carico un problema, proporre un piano e realizzarlo, sempre con la supervisione dello sviluppatore. Questo progetto si inserisce nel nostro obiettivo di lungo termine di sviluppare agenti basati sull'AI utili in ogni ambito, incluso quello della programmazione.
Agenti nei giochi e in altri domini Google
Abbiamo creato agenti usando Gemini 2.0 che possono aiutarti a navigare nel mondo virtuale dei videogiochi. Possono ragionare sul gioco basandosi esclusivamente sulle azioni visibili sullo schermo e offrire suggerimenti in tempo reale su cosa fare dopo attraverso una conversazione.
Collaboriamo con aziende produttrici di videogiochi leader come Supercell per studiare il funzionamento di questi agenti, verificandone le capacità nel gestire regole e sfide in giochi diversi, dai titoli strategici come "Clash of Clans" ai simulatori di fattoria come "Hay Day".
Questi agenti non si limitano a essere assistenti virtuali nei giochi: grazie alla Ricerca Google, ti connettono con tutta la conoscenza videoludica disponibile online.
Ulteriori dettagli su Gemini 2.0 e le nuove frontiere dell'era AI agenziale da Google partendo da qui.