Veo 2 di Google crea video pazzeschi in 4K da prompt testuali

dic 17, 2024

Ecco il nuovo livello dell'intelligenza artificiale generativa raggiunto dalla divisione DeepMind di Google.

Veo 2 di Google crea video pazzeschi in 4K da prompt testuali

Google
non si ferma ai recenti annunci di Veo e Imagen 3 per la generazione di video e immagini AI da prompt testuali, ma risponde alla disponibilità di Sora di OpenAI mostrando le capacità del modello più evoluto di DeepMind, Veo 2

Veo 2 supera qualsiasi altra soluzione attualmente conosciuta per la generazione di video realistici permettendo la creazione di filmati che possono avere durata di minuti e la qualità della risoluzione 4K. Per fare un confronto con il modello di OpenAI, Sora può generare video della durata di 20 secondi a risoluzione 1080p (per gli utenti abbonati a ChatGPT Pro).

Veo 2 di Google DeepMind può essere provato iscrivendosi alla lista di attesa su VideoFX.

Ecco un esempio di video (breve) generato con Veo 2:


E questo il prompt utilizzato:

La telecamera fluttua dolcemente tra file di alveari di legno dipinti a pastello, ronzanti api che scivolano dentro e fuori dall'inquadratura. Il movimento si ferma sul raffinato contadino in piedi al centro, con la sua immacolata tuta bianca da apicoltore che brilla nella luce dorata del pomeriggio. Solleva un barattolo di miele, inclinandolo leggermente per catturare la luce. Dietro di lui, alti girasoli ondeggiano ritmicamente nella brezza, i cui petali brillano nella calda luce del sole. La telecamera si inclina verso l'alto per rivelare una fattoria retrò con persiane verde menta, le cui pareti sono punteggiate dalle ombre degli alberi ondeggianti. Riprese con un obiettivo da 35 mm su pellicola Kodak Portra 400, la luce dorata crea ricche texture sui guanti del contadino, sul barattolo di marmellata e sul legno stagionato degli alveari.

Ed ecco una piccola compilation di video generati da Veo 2:

 
Con l'apertura della lista di attesa per provare Veo 2, Google ha annunciato anche miglioramenti per Imagen 3, che adesso genera immagini migliori e più luminose, e un nuovo strumento sperimentale denominato Whisk che permette di generare immagini partendo da soggetti di foto caricate dall'utente.

Whisk, il nostro ultimo esperimento di Google Labs, ti consente di inserire o creare immagini che trasmettono il soggetto, la scena e lo stile che hai in mente. Quindi, puoi unirli e remixarli per creare qualcosa di unico e tuo, da un peluche digitale a una spilla o un adesivo smaltato.

Sotto il cofano, Whisk combina il nostro ultimo modello Imagen 3 con le capacità di comprensione visiva e descrizione di Gemini. Il modello Gemini scrive automaticamente una didascalia dettagliata delle tue immagini e poi inserisce quelle descrizioni in Imagen 3. Questo processo ti consente di remixare facilmente i tuoi soggetti, scene e stili in modi nuovi e divertenti.

Guarda l'introduzione nel video seguente.

Articolo di HTNovo
Creative Commons License

Modulo di contatto

Archivio