100 annunci di Google a I/O 2024

mag 16, 2024

Tanta intelligenza artificiale, ma non solo. Ecco 100 cose annunciate da Google durante il più importante evento annuale dedicato al suo ecosistema.

100 annunci di Google a I/O 2024

Anche quest'anno vi abbiamo coperto con dirette e contenuti dall'evento Google I/O 2024, partendo dalle anticipazioni, passando per il live del Keynote d'apertura e da tutto ciò che di importante è stato annunciato alla conferenza per utenti, partner e sviluppatori di Big G in questi giorni.


A seguire, il consueto riepilogo fornitoci direttamente da Google con l'elenco di 100 annunci arrivati da I/O 2024.

100 annunci di Google a I/O 2024

Momenti di intelligenza artificiale

1. Abbiamo introdotto Gemini 1.5 Flash: un modello più leggero progettato per essere veloce ed efficiente per servire su vasta scala. 1.5 Flash è il modello Gemini più veloce servito nell'API.

2. Abbiamo migliorato significativamente 1.5 Pro, il nostro miglior modello per prestazioni generali in un'ampia gamma di attività.

3. Sia 1.5 Pro che 1.5 Flash sono disponibili in anteprima pubblica con una finestra di contesto da 1 milione di token su Google AI Studio e Vertex AI.

4. 1.5 Pro è disponibile anche con una finestra di contesto da 2 milioni di token per gli sviluppatori tramite lista d'attesa in Google AI Studio e Vertex AI.

5. Abbiamo condiviso Project Astra: la nostra visione per il futuro degli assistenti AI.

6. Abbiamo annunciato Trillium , la sesta generazione del nostro acceleratore AI personalizzato, la Tensor Processing Unit (TPU). È il TPU più performante fino ad oggi.

7. Rispetto al TPU v5e, i TPU Trillium raggiungono un aumento di 4,7 volte delle prestazioni di calcolo di picco per chip.

8 . Sono anche la nostra generazione più sostenibile: i TPU Trillium sono oltre il 67% più efficienti dal punto di vista energetico rispetto ai TPU v5e.

9. Abbiamo inoltre presentato una dimostrazione di un primo prototipo di Panoramica audio per NotebookLM, che utilizza una raccolta di materiali caricati per creare una discussione verbale personalizzata per l'utente.

10. Abbiamo annunciato che Grounding with Google Search, uno strumento che collega il modello Gemini con la conoscenza del mondo, un'ampia gamma possibile di argomenti o informazioni aggiornate su Internet, è ora generalmente disponibile su Vertex AI.

11. Abbiamo aggiunto la comprensione dell'audio nell'API Gemini e in AI Studio, quindi Gemini 1.5 Pro ora può ragionare su immagini e audio per i video caricati in AI Studio.

12. A partire da Pixel, le applicazioni che utilizzano Gemini Nano con Multimodalità saranno in grado di comprendere il mondo come fanno le persone, non solo attraverso l'immissione di testo ma anche attraverso la vista, l'udito e il linguaggio parlato.

Modelli di media generativi ed esperimenti di Labs

13. Abbiamo annunciato Imagen 3 , il nostro modello di generazione di immagini della massima qualità mai realizzato.

14. L'immagine 3 comprende il linguaggio naturale e l'intento dietro le tue istruzioni e incorpora piccoli dettagli da istruzioni più lunghe. Ciò aiuta a generare un incredibile livello di dettaglio, producendo immagini fotorealistiche e realistiche con molti meno artefatti visivi che distraggono rispetto ai nostri modelli precedenti.

15. Imagen 3 è anche il nostro miglior modello finora per il rendering del testo: una sfida per i modelli di generazione di immagini.

16. Abbiamo distribuito Imagen 3 ai Trusted Tester in ImageFX e puoi iscriverti per iscriverti alla lista d'attesa.

17. Imagen 3 arriverà anche su Vertex AI quest'estate.

18. Poi abbiamo annunciato Veo, il nostro modello di generazione video più capace finora. Genera video con risoluzione 1080p di alta qualità che possono andare oltre un minuto, in un'ampia gamma di stili cinematografici e visivi.

19. In futuro porteremo alcune delle funzionalità di Veo anche su YouTube Shorts e altri prodotti.

20. Abbiamo mostrato cosa Veo può aiutare gli artisti a fare collaborando con registi, tra cui Donald Glover, che ha sperimentato Veo per un progetto cinematografico.

21. Abbiamo evidenziato Music AI Sandbox, una suite di strumenti di intelligenza artificiale musicale che consentono alle persone di creare nuove sezioni strumentali da zero, trasferire stili tra tracker e molto altro. Puoi trovare alcune canzoni nuove di zecca da queste collaborazioni, tra cui una di Wyclef Jean e un'altra di Marc Rebillet, su YouTube ora.

22. E assicurati di dare un'occhiata a Infinite Wonderland , un'esperienza in cui artisti e creativi di Google hanno sperimentato insieme per mettere a punto un modello di intelligenza artificiale per reimmaginare all'infinito il mondo visivo del romanzo "Le avventure di Alice nel paese delle meraviglie". I lettori di Infinite Wonderland possono generare immagini apparentemente infinite per ciascuna delle 1.200 frasi del libro in base al rispettivo stile di ciascun artista.

23. Abbiamo annunciato VideoFX , il nostro nuovissimo strumento sperimentale che utilizza Veo, il modello video generativo di Google DeepMind, e ti consente di trasformare un'idea in un video clip.

24. Viene fornito anche con una modalità Storyboard che ti consente di ripetere scena per scena e aggiungere musica al tuo video finale.

25. Abbiamo aggiunto più controlli editoriali a ImageFX , una delle principali richieste della community, in modo da poter aggiungere, rimuovere o modificare elementi semplicemente sfiorando la tua immagine.

26. ImageFX utilizzerà anche Imagen 3 per sbloccare più fotorealismo con dettagli più ricchi, meno artefatti visivi e un rendering del testo più accurato.

27. MusicFX ha una nuova funzionalità chiamata "DJ Mode" che ti aiuta a mixare ritmi combinando generi e strumenti, utilizzando la potenza dell'intelligenza artificiale generativa per dare vita a storie musicali.

28. A partire da questa settimana, ImageFX e MusicFX sono ora disponibili in oltre 100 paesi tramite Labs.

Nuovi modi per fare di più con l'app Gemini

29. Stiamo offrendo Gemini 1.5 Pro, il nostro modello all'avanguardia, agli abbonati Gemini Advanced, il che significa che Gemini Advanced ora ha una finestra di contesto da 1 milione di token e può fare cose come dare un senso a PDF di 1.500 pagine.

30. Ciò significa anche che Gemini Advanced ora ha la finestra di contesto più grande di qualsiasi chatbot disponibile in commercio al mondo.

31. Abbiamo aggiunto la possibilità di caricare file tramite Google Drive o direttamente dal tuo dispositivo direttamente in Gemini Advanced.

32. Presto Gemini Advanced ti aiuterà ad analizzare i tuoi dati per scoprire rapidamente approfondimenti e creare grafici da file di dati caricati come fogli di calcolo.

33. Ottime notizie per i viaggiatori: Gemini Advanced ha una nuova funzionalità di pianificazione che va oltre un elenco di attività suggerite e creerà effettivamente un itinerario personalizzato solo per te.

34. Poi c'è Gemini Live per gli abbonati Gemini Advanced, una nuova esperienza di conversazione mobile-first che utilizza una tecnologia vocale all'avanguardia per aiutarti ad avere conversazioni parlate più naturali e intuitive con Gemini.

35. Gemini Live ti consente di scegliere tra 10 voci dal suono naturale con cui può risponderti; inoltre, puoi parlare al tuo ritmo o interrompere a metà risposta con domande chiarificatrici.

36. Gemini in Google Messaggi ora ti consente di chattare con Gemini nella stessa app in cui invii messaggi ai tuoi amici.

37. Gli abbonati Gemini Advanced saranno presto in grado di creare Gemme, versioni personalizzate di Gemini progettate per qualunque cosa tu sogni. Descrivi semplicemente cosa vuoi che faccia la tua Gemma e come vuoi che risponda e Gemini seguirà queste istruzioni e creerà una Gemma per le tue esigenze specifiche.

38. E cerca altri strumenti Google collegati a Gemini, inclusi Google Calendar, Attività, Keep e Orologio.

Aggiornamenti che consentono alla Ricerca di lavorare per te

39. Stiamo utilizzando un nuovo modello Gemini personalizzato per Ricerca Google per riunire le funzionalità avanzate di Gemini, tra cui ragionamento in più fasi, pianificazione e multimodalità, con i nostri migliori sistemi di ricerca.

40. Le panoramiche AI ​​nella ricerca saranno disponibili a tutti negli Stati Uniti a partire da questa settimana e presto arriveranno altri paesi.

41. E le funzionalità di ragionamento in più fasi saranno presto disponibili nelle panoramiche AI ​​nei laboratori di ricerca per le query in inglese negli Stati Uniti Quindi, invece di suddividere la tua domanda in più ricerche, puoi porre domande complesse come "trova i migliori studi di yoga o pilates a Boston e mostra i dettagli sulle loro offerte introduttive e sul tempo di percorrenza da Beacon Hill."

42. Presto sarai in grado di modificare la tua Panoramica AI con opzioni per semplificare il linguaggio o suddividerlo in modo più dettagliato, quando sei nuovo in un argomento o cerchi di arrivare al nocciolo di un argomento.

43. Anche la ricerca sta ottenendo nuove capacità di pianificazione. Ad esempio, la pianificazione di pasti e viaggi con personalizzazione verrà lanciata entro la fine dell'anno in Search Labs, seguita presto da altre categorie come feste e fitness.

44. Grazie ai progressi nella comprensione dei video, ora hai la possibilità di porre domande con un video. La ricerca può prendere una domanda visiva complessa e risolverla per te, quindi spiegare i passaggi successivi e offrire risorse con una panoramica dell'intelligenza artificiale.

45. E presto, l'intelligenza artificiale generativa nella ricerca creerà anche una pagina di risultati organizzata dall'intelligenza artificiale quando cerchi nuove idee. Queste pagine dei risultati di ricerca organizzate dall'intelligenza artificiale saranno disponibili quando cerchi categorie come ristoranti, ricette, film, musica, libri, hotel, shopping e altro ancora.

Aiuto dai modelli Gemini in Workspace e Foto

46. ​​Gemini 1.5 Pro è ora disponibile nel pannello laterale in Gmail, Documenti, Drive, Presentazioni e Fogli tramite Workspace Labs e verrà distribuito ai nostri clienti Gemini for Workspace e agli abbonati a Google One AI Premium il mese prossimo.

47. Potrai utilizzare il pannello laterale di Gmail per riepilogare le email per ottenere i dettagli e le azioni più importanti.

48. Oltre ai riepiloghi, l'app mobile di Gmail utilizzerà presto Gemini per altre due nuove funzionalità: Risposta intelligente contestuale e Domande e risposte su Gmail.

49. Nelle prossime settimane, Aiutami a scrivere in Gmail e Documenti supporterà lo spagnolo e il portoghese.

50. Entro la fine dell'anno in Labs, potrai anche chiedere a Gemini di organizzare automaticamente gli allegati e-mail in Drive, generare un foglio con i dati e quindi analizzarlo con domande e risposte sui dati.

51. Una nuova funzionalità sperimentale in Google Foto chiamata Chiedi Foto rende ancora più semplice la ricerca di ricordi specifici o il richiamo di informazioni incluse nella tua galleria. La funzionalità utilizza i modelli Gemini e verrà implementata nei prossimi mesi.

52. Puoi anche utilizzare Chiedi foto per creare una galleria dei momenti salienti di un viaggio recente e scriverà anche didascalie personalizzate da condividere sui social media.

Avanzamenti di Android

53. A partire da Pixel entro la fine dell'anno, Gemini Nano, il modello base integrato su dispositivo di Android, avrà funzionalità multimodali. Oltre a elaborare semplicemente l'input di testo, il tuo telefono Pixel sarà anche in grado di comprendere più informazioni in contesto come immagini, suoni e linguaggio parlato.

54. Talkback, una funzionalità di accessibilità per dispositivi Android che aiuta le persone non vedenti e ipovedenti a utilizzare il feedback tattile e vocale per interagire meglio con i propri dispositivi, è stata migliorata grazie a Gemini Nano con Multimodalità.

55. Una nuova funzionalità di protezione dalle truffe attivabile che utilizzerà l'intelligenza artificiale integrata di Gemini Nano per aiutare a rilevare le chiamate telefoniche truffaldine preservando la privacy. Cerca maggiori dettagli entro la fine dell'anno.

56. Abbiamo annunciato che Circle to Search è attualmente disponibile su oltre 100 milioni di dispositivi Android e siamo sulla buona strada per raddoppiarlo entro la fine dell'anno.

57. Presto sarai in grado di utilizzare Gemini su Android per creare e trascinare e rilasciare le immagini generate in Gmail, Google Messaggi e altro, o chiedere informazioni sul video di YouTube che stai visualizzando.

58. Se disponi di Gemini Advanced, avrai anche la possibilità di "Chiedi questo PDF" per ottenere una risposta rapidamente senza dover scorrere più pagine.

59. Gli studenti possono ora utilizzare Circle per cercare aiuto per i compiti direttamente da telefoni e tablet Android selezionati. Questa funzionalità è supportata da LearnLM, la nostra nuova famiglia di modelli basati su Gemini, ottimizzati per l'apprendimento.

60. Entro la fine dell'anno, Circle to Search sarà in grado di risolvere problemi ancora più complessi che coinvolgono formule simboliche, diagrammi, grafici e altro ancora.

61. Oh, e abbiamo introdotto la seconda beta di Android 15.

62. Il blocco rilevamento furto utilizza la potente intelligenza artificiale di Google per rilevare se il tuo dispositivo è stato rubato e bloccare rapidamente le tue informazioni sul telefono.

63. Lo spazio privato arriverà su Android 15, che ti consente di scegliere le app da proteggere all'interno di uno spazio separato che richiede un ulteriore livello di autenticazione per essere aperto.

64. E se una schermata di blocco separata non è sufficiente per i tuoi spazi privati, puoi nasconderne del tutto l'esistenza.

65. Entro la fine dell’anno, Google Play Protect utilizzerà l’intelligenza artificiale sul dispositivo per individuare le app che tentano di nascondere le proprie azioni per commettere frodi o phishing.

66. Stiamo portando un'esperienza di messaggistica aggiornata in Giappone con RCS in Google Messaggi.

67. Presto negli Stati Uniti sarai in grado di creare una versione digitale dei pass che contengono solo testo. Basta scattare una foto di un pass (come una tessera assicurativa o un biglietto per un evento) e aggiungerla facilmente al tuo Google Wallet per accedervi rapidamente.

68. Abbiamo mostrato come i contenuti di realtà aumentata saranno disponibili direttamente in Google Maps, gettando le basi per una piattaforma di realtà estesa (XR) che stiamo costruendo in collaborazione con Samsung e Qualcomm per l'ecosistema Android.

69. Ora puoi recuperare gli episodi dei tuoi programmi preferiti su Max e Peacock o iniziare una partita ad Angry Birds su auto selezionate con Google integrato.

70. Stiamo portando Google Cast anche sulle auto con sistema operativo Android Automotive, a partire da Rivian nei prossimi mesi, in modo da poter trasmettere facilmente contenuti video dal tuo telefono all'auto.

71. Entro la fine dell'anno, le ottimizzazioni della durata della batteria arriveranno agli orologi con Wear OS 5. Ad esempio, correre una maratona all'aperto consumerà fino al 20% in meno di energia rispetto agli orologi con Wear OS 4.

72. Wear OS 5 offrirà inoltre alle app per il fitness la possibilità di supportare più tipi di dati come il tempo di contatto con il suolo, la lunghezza del passo e l'oscillazione verticale.

73. Ora è più semplice scegliere cosa guardare su Google TV e altri dispositivi con sistema operativo Android TV con descrizioni personalizzate generate dall'intelligenza artificiale, grazie al nostro modello Gemini.

74. Queste descrizioni generate dall'intelligenza artificiale riempiranno anche le descrizioni mancanti o non tradotte di film e spettacoli.

75. Ecco una statistica divertente: dal lancio, le persone hanno effettuato oltre 1 miliardo di connessioni Fast Pair.

76. Entro la fine del mese, sarai in grado di utilizzare Fast Pair per connetterti e trovare oggetti come chiavi, portafoglio o bagagli nell'app Trova il mio dispositivo con i tag tracker Bluetooth di Chipolo e PebblePee (con altri partner in arrivo).

Sviluppi per sviluppatori

77. Puoi partecipare al concorso per sviluppatori API Gemini e partecipare alla scoperta delle app AI più utili e innovative. Il premio: una DeLorean personalizzata del 1981 dotata di retrofit elettrico.

78. Abbiamo introdotto PaliGemma, il nostro primo modello aperto di linguaggio visivo ottimizzato per domande e risposte visive e sottotitoli di immagini.

79. Abbiamo presentato in anteprima la prossima versione di Gemma, Gemma 2. È costruita su un'architettura completamente nuova e includerà un'istanza di parametri più grande da 27B che supera i modelli di dimensioni doppie e viene eseguita su un singolo host TPU.

80. I modelli Gemini sono ora disponibili per aiutare gli sviluppatori a essere più produttivi in ​​Android Studio, IDX, Firebase, Colab, VSCode, Cloud e Intellj.

81. Gemini 1.5 Pro arriverà su Android Studio entro la fine dell'anno. Dotato di un'ampia finestra di contesto, questo modello porta a risposte di qualità superiore e sblocca casi d'uso come l'input multimodale.

82. Google AI Studio è ora disponibile in più di 200 paesi tra cui Regno Unito e UE.

83. La chiamata di funzioni parallele e l'estrazione di fotogrammi video sono ora supportate dall'API Gemini.

84. E con la nuova funzionalità di memorizzazione nella cache del contesto nell'API Gemini, in arrivo il mese prossimo, sarai in grado di semplificare i flussi di lavoro per prompt di grandi dimensioni memorizzando nella cache i file di contesto utilizzati di frequente a costi inferiori.

85. Android ora fornisce un supporto di prima classe per la multipiattaforma Kotlin per aiutare gli sviluppatori a condividere la logica di business delle loro app su più piattaforme.

86. L'emulatore ridimensionabile, la modalità di controllo dell'interfaccia utente Componi e lo streaming di dispositivi Android basato su Firebase sono nuovi prodotti che possono aiutare gli sviluppatori a creare per tutti i fattori di forma.

87. A partire da Chrome 126, Gemini Nano sarà integrato nel client Chrome Desktop.

88. L'API View Transitions per app multipagina, una funzionalità molto richiesta, è ora disponibile in modo che gli sviluppatori possano facilmente creare una navigazione fluida e fluida simile a quella delle app, indipendentemente dall'architettura del sito.

89. Project IDX, la nostra nuova esperienza integrata per sviluppatori per app full-stack e multipiattaforma, è ora aperta a tutti per provarla.

90. Firebase ha rilasciato Firebase Genkit in beta, che renderà ancora più semplice per gli sviluppatori creare esperienze di intelligenza artificiale generativa nelle loro app.

91. Firebase ha anche rilasciato Firebase Data Connect, un nuovo modo per gli sviluppatori di utilizzare SQL con Firebase (tramite Google Cloud SQL). Ciò non solo porterà i flussi di lavoro SQL su Firebase, ma ridurrà anche la quantità di codice dell'app che gli sviluppatori devono scrivere.

92. Abbiamo portato gli sviluppatori sotto il cofano in una conversazione approfondita sulla tecnologia e la ricerca che alimenta la nostra intelligenza artificiale con James Manyika, Jeff Dean e Koray Kavukcuoglu.

Progresso responsabile dell’IA

93. Stiamo migliorando il red teaming - una pratica collaudata in cui testiamo in modo proattivo i punti deboli dei nostri sistemi e proviamo a romperli - attraverso una nuova tecnica che chiamiamo "Red Teaming assistito dall'intelligenza artificiale".

94. Stiamo anche espandendo SynthID a due nuove modalità: testo e video.

95. Anche la filigrana del testo SynthID sarà open source nei prossimi mesi attraverso il nostro toolkit aggiornato di Responsible Generative AI.

96. Abbiamo annunciato LearnLM, una nuova famiglia di modelli basati su Gemini e ottimizzati per l'apprendimento. LearnLM sta già supportando una serie di funzionalità nei nostri prodotti, tra cui Gemini, Ricerca, YouTube e Google Classroom.

97. Collaboreremo con esperti di istituzioni come il Columbia Teachers College, l'Arizona State University, la NYU Tisch e la Khan Academy per perfezionare ed espandere LearnLM oltre i nostri prodotti.

98. Abbiamo anche collaborato con il MIT RAISE per sviluppare un corso online che consenta agli insegnanti di utilizzare in modo efficace l’intelligenza artificiale generativa in classe.

99. Abbiamo creato un nuovo strumento sperimentale chiamato Illuminate per rendere la conoscenza più accessibile e digeribile.

100. lluminate può generare una conversazione composta da due voci generate dall'intelligenza artificiale, fornendo una panoramica delle informazioni chiave emerse dai documenti di ricerca. Puoi registrarti per provarlo oggi stesso su labs.google.

Articolo di HTNovo
Creative Commons License

Modulo di contatto

Archivio