LA VIDEO PAR IA, SORA-T-ON S’EN PASSER ?

CREER UNE VIDEO PAR IA AVEC DES MOTS, ON SORA BIENTOT LE FAIRE !

La création vidéo par le biais de son clavier est sur le point de devenir une réalité grâce aux avancées de l’IA!

Car depuis quelques mois, de nouveaux outils de création vidéo par IA tel que Kaiber ou Capcut ont fait leur apparition. Ils offrent la possibilité de générer une vidéo à partir d’instructions textuelles, également connues sous le nom de prompt. Ces outils, bien qu’ils aient simplifié le processus de création de vidéo, restent très limité. Les vidéos qu’ils génèrent sont « fonctionnelles » elle manque souvent de créativité et de finesse. Leur rendu n’est pas encore assez qualitatif pour remplacer nos bonnes vielles caméra.

Cependant, le 15 février 2024, OpenAI, les cracks à l’origine du révolutionnaire Chat-GPT, a dévoilé au monde son dernier banger : SORA.

Visuel créé par l’IA SORA 

Visuel créé par l’IA SORA

UNE IA PROMETTEUSE

SORA, qui signifie « ciel » en japonais, représente une avancée majeure dans le domaine de la création vidéo par IA.

SORA n’est même par encore sortie et sa première version est déjà capable de créer des visuels époustouflants. Les vidéos proposées commencent déjà à faire preuve d’un réalisme troublant. Cette capacité prometteuse laisse entrevoir un potentiel sans fin pour l’avenir de la création vidéo par IA.

SORA n’est pas encore disponible au grand public, seulement une poignée d’experts ont accès à l’outil et peuvent le tester afin d’en trouver les failles et les risques.

Ce qui est sûr, c’est que l’IA va mettre une claque au monde de la vidéo, et particulièrement aux banques vidéo telles qu’Adobe Stock, Shutterstock, iStock…

Je n’aimerais pas être à leur place…

LES LIMITES ÉTHIQUES DE LA VIDEO PAR IA

Heureusement, ou pas, comme son cousin Chat-GPT, l’IA SORA ne peut pas produire de vidéo violente, sexuelle, ni représenter des célébrités. Tout ça pour nous protéger nos esprits fragiles et prévenir les risques liés aux deepfakes.

Ça limite les possibilités créatives de SORA. Mais si ça peut nous éviter de revoir une nouvelle vidéo perturbante de Will Smith mangeant des nouilles, on ne dit pas non…

Vidéo créée par l’IA ModelScope Text to Video Synthesis

COMMENT SORA CRÉÉ UNE VIDEO ? 

SORA s’appuie sur une architecture de transformateur, tout comme les modèles GPT. Dans un réseau neuronal, comme ce qu’il y a dans notre cerveau (mais en moins bête). Cette architecture permet au transformateur d’analyser les relations entre les composants d’une séquence. Cela lui permet de transformer une séquence d’entrée en une séquence de sortie, et donc de générer une réponse à une requête donnée. Cette approche peut donner l’illusion que l’IA comprend la question et réfléchit pour produire une réponse pertinente.

Il est important de noter qu’aucune capacité de raisonnement réelle n’est impliquée. Au lieu de cela, ce sont des algorithmes utilisant des représentations mathématiques qui mettent en relation les concepts entre eux (on vaut toujours mieux qu’eux, pour l’instant) …

En ce qui concerne le traitement visuel, SORA adopte une approche différente de celle des grands modèles de langage (LLM), qui utilisent des jetons dans leur fonctionnement. SORA utilise ce qu’OpenAI décrit comme des « patchs » pour ses opérations visuelles. Cette méthode, déjà éprouvée dans le domaine de la visualisation de données, consiste à compresser les vidéos en patchs. Ces patchs fonctionnent de manière similaire aux jetons dans le processus de traitement par le transformateur. Ils peuvent être exploités pour reconstituer une vidéo (ou une image) en utilisant les capacités du transformateur.

Crédit : Open AI 

Pendant le processus de création, la vidéo ressemble à un bruit statique (un peu comme Canal+ en crypté). Pour petit à petit se transformer en une vidéo détaillée.

Illustration du site d'OpenAI

Crédit : Open AI

UNE IA PAS SI INTELLIGENTE ?

Comme pour le générateur d’images DALL-E, SORA utilise une banque de données.

Lui donnant des exemples sur lequel s ’inspirer lors du processus de création d’images. Ce qui permet à l’IA de créer des images d’une grande justesse. Il a été cependant démontré que certaines vidéos ressemblaient beaucoup à des vidéos stocks déjà existants.

vidéo généré par l’IA SORAvidéo shutterstock 

A gauche une vidéo générée par l’IA SORA et à droite une vidéo shutterstock

ON IA TOUS DOUCEMENT !

SORA n’est pas encore sorti, il se peut que l’IA ne soit pas aussi puissante que ce qu’Open AI veut nous faire croire. Tout amateur de jeu vidéo sais qu’il ne faut pas se fier au trailer. Alors attendons encore un peu et profitons de nos caméras et de nos appareils photo pour capter le réel, avant que la machine prenne le relais.

La machine, nous remplacera-t-elle ?