Basta una singola immagine fotografica per creare un video: si chiama Transframer ed è un nuovo strumento targato Google che si basa sull’intelligenza artificiale per creare una rappresentazione prospettica di oggetti ed ambienti, in grado di aggiungere movimento spaziale quadrimensionale ad immagini statiche. Vediamo di cosa si tratta.
E’ un sistema predittivo arbitrario. In altre parole, è un software basato sull’intelligenza artificiale e creato da Deep Mind, la rete neurale di Google, che “immagina” la tridimensionalità di un oggetto mostrato nelle bidimensioni, introducendolo poi nella quarta.
D’accordo, fermi tutti: capiamolo meglio. Quali operazioni effettua il software? Partendo da una fotografia, analizza gli oggetti presenti in essa. Essendo un’immagine, gli oggetti vengono mostrati nel due dimensioni di altezza e larghezza. Il software, quindi, attraverso un poderoso set di dati su cui è stato “addestrato”, aggiunge agli oggetti la terza dimensione della profondità, immaginando come dovrebbe mostrarsi se osservato da altre angolazioni. Infine, crea automaticamente il movimento all’interno della scena, aggiungendo dunque la quarta dimensione del tempo.
Ed ecco come Transframer, così battezzato da Deep Mind di Google, è in grado di trasformare immagini statiche in video dinamici, scegliendo con un certo di livello di accuratezza (ma anche di arbitrarietà) come utilizzare la prospettiva per creare volume, profondità e movimento.
Parola chiave: verosimiglianza. Ovvero: i risultati ottenuti da Transframer, per quanto sembrino reali, sono soltanto presunti
Ancora una volta, la tecnologia ci consente di disporre di un potentissimo strumento con possibilità d’impiego molteplici e, al contempo, potenzialmente virtuose ma anche potenzialmente pericolose.
Ad esempio, Transframer potrebbe essere impiegato per la creazione di ambienti virtuali a scopo scientifico, artistico oppure ludico e, in queste circostanze, il suo potenziale verrebbe posto al servizio della ricerca e dello sviluppo per riprodurre predizioni visive fittizie a beneficio delle fasi di studio, di messa in scena o di gioco.
Tuttavia, lo strumento si presta senza alcun dubbio anche alla proliferazione di attività di cosiddetto “deepfake”, ovvero di produzione di ambientazioni e situazioni fittizie presentate invece come reali, aumentando confusione e diffidenza soprattutto in ambito comunicativo e divulgativo. Un utilizzo corretto di potenze di calcolo di una tale magnitudine è davvero imperativo, e capiremo presto quale futuro attenderà le applicazioni che verranno effettuate di Transframer, tra spinte opposte di commercializzazione e speculazione a tutti i costi da un lato, e responsabilità in tema di utilizzo e distribuzione dall’altro.
Transframer is a general-purpose generative framework that can handle many image and video tasks in a probabilistic setting. New work shows it excels in video prediction and view synthesis, and can generate 30s videos from a single image: https://t.co/wX3nrrYEEa 1/ pic.twitter.com/gQk6f9nZyg
— DeepMind (@DeepMind) August 15, 2022
FONTE: www.hwupgrade.it