La faccia non serve più: Nvidia lancia la nuova generazione delle videocall

Nvidia svela come l’Intelligenza Artificiale ci permetterà di effettuare conference call con il nostro capo rimanendo in pigiama.

Nvidia Vid2Vid Cameo (blogs.nvidia.com)
(blogs.nvidia.com)

Nvidia tira fuori dal cilindro la nuova generazione delle video chiamate. Quella in cui non sarà più necessario metterci la faccia, perché basterà una foto o un avatar animato a fare il lavoro al posto nostro. Insomma, come dice lo stesso gigante delle GPU, potremo partecipare alla conference call con il nostro capo con ancora indosso il pigiama. Tanto lui o lei ci vedranno sempre impeccabili. Anche se un po’ standardizzati.

La trovata di Nvidia si basa sull’Intelligenza Artificiale del programma Vid2Vid Cameo. Sa tanto di digitalizzazione del digitale, dobbiamo ammetterlo, ma ha i suoi vantaggi. Presentato a fine 2020, Vid2Vid Cameo utilizza un modello di deep learning che prende le mosse da 180mila video. Da questi, il computer apprende le evoluzioni dell’espressività facciale, i movimenti delle labbra e della testa, la direzione degli occhi. D’accordo, forse espressività è una parola un po’ troppo forte in questo contesto, ma il risultato è una nostra immagine virtuale che guarda dritto in camera e muove le labbra mentre noi gli diamo voce.

Nvidia Vid2Vid Cameo: come funziona

Zoom Immersive View
(Photo by Anna Shvets from Pexels)

Le informazioni così recepite saranno poi applicate all’animazione di una foto o un avatar a nostra scelta tramite un modello detto generative adversarial network (Gan), di fatto quello che consente alla macchina di imparare – e riprodurre – come si comporta il modello. In questo caso, il modello sarà l’utente inquadrato dalla webcam, e il risultato sarà l’animazione della foto o dell’avatar prescelto, che sarà trasmesso al posto della nostra vera faccia sullo schermo del nostro interlocutore.

PROVA A LEGGERE>>>La Cina porterà il primo uomo su Marte? È guerra con gli USA

La tecnologia di Vid2Vid Cameo offre anche un miglioramento pratico della chiamata, visto che l’informazione digitale prodotta può raggiungere un livello di compressione impensabile per il live streaming di audio e video. La trasmissione riguarderà solo il segnale audio e le informazioni necessarie per l’animazione dell’immagine che ci sostituisce sullo schermo, con un considerevole risparmio sulla banda e una conseguenza evidente in fatto di qualità dell’immagine e stabilità della connessione.

FORSE TI INTERESSA—>Microsoft, al via una nuova era: Windows 11 rivoluzionerà il prossimo decennio

Difficile dire come il pubblico accoglierà il nuovo approccio alla comunicazione a distanza proposto da Nvidia. Come avviene sempre in certe circostanze, si ha la tentazione di mettere le mani avanti e puntare i piedi contro la costante virtualizzazione delle nostre vite. Ma si finisce per arroccarsi su posizioni inutilmente anacronistiche. E poi, c’è sempre l’opportunità di fare dei distinguo. Tutto sommato, spersonalizzare una chiamata di lavoro potrebbe non essere una tragedia. Magari con i nostri cari sarà invece più bello continuare a metterci la faccia ed essere più autentici possibile, anche se la nostra immagine non sarà perfetta e noi saremo ancora in pigiama.

Gestione cookie