ce qu’il peut faire et comment ça marche

Alexis Tremblay
Alexis Tremblay

OpenAI créé Soraune nouvelle solution liée àintelligence artificielle générative, qui vous permet de créer des vidéos à partir d’une simple saisie textuelle. Pour être clair, c’est une sorte de « ChatGPT pour créer des vidéos » grâce auquel vous pouvez animer des images déjà existantes ou créer des scènes à partir de zéro, à partir de simples commandes de texte, de la même manière que ce qui se passe avec LUI DONNER pour les images. Sora n’est pas le premier outil d’IA générative pour texte en vidéomais selon OpenAI, il se distingue par le haut degré de réalisme et la possibilité de générer des vidéos plus longues que la concurrence (jusqu’à 1 minute).

Sora est actuellement en phase de test et il n’est pas accessible au public: comme le déclare OpenAI lui-même, l’outil a en effet encore des limites et surtout il n’est pas exempt des risques qu’entraînerait une mauvaise utilisation de cette technologie, comme ceux liés à désinformation. Pour cette raison, l’application n’est disponible que pour un groupe limité de créateurs et d’experts en sécurité. Cependant, il existe déjà diverses vidéos sur Internet qui montrent à quel point l’utilisation de Sora peut être puissante pour générer des vidéos avec l’IA.

Ce que Sora peut faire

Que fait Sora ? À partir des vidéos mises en ligne, vous pouvez apprécier la complexité des scènes créées par le système texte en vidéo d’OpenAI parvient à produire. Dans le vidéos générées à partir de textes plusieurs personnages peuvent être inclus avec des détails précis concernant à la fois les sujets représentés et l’arrière-plan des scènes, des types de mouvements spécifiques et plusieurs plans peuvent être créés dans une seule vidéo créée en simulant l’utilisation de plusieurs caméras.

OpenAI Sora |  Géopop

De plus, Sora est capable de comprendre non seulement quelle requête l’utilisateur fait en tapant le rapide (c’est-à-dire la commande textuelle), qui lui permet d’interpréter avec précision des instructions et de générer des personnages qui expriment des émotions qui semblent « réelles » et qui bougent en tenant compte des lois physiques.

De plus, comme mentionné précédemment, Sora est non seulement capable de générer des vidéos à partir d’instructions textuelles, mais il peut également prendre une image statique déjà existante et « l’animer » avec une attention aux détails vraiment impressionnante. Le modèle peut également partir d’une séquence existante et aller remplir les cadres manquants ou l’étendre.

Les premières vidéos hyper réalistes générées par Sora

Voilà quelque exemples de vidéos réalisés avec Sora, qui montrent les capacités de cette application à générer des vidéos très réalistes :

Quelles sont les limites de Sora

Mais comme on dit « tout ce qui brille n’est pas d’or ». Le modèle comporte également limites et faiblesses. Parmi ceux-ci, il y a le fait que il n’est pas toujours capable de simuler des scènes complexescomme ceux qui concernent les sorties dans lesquelles des éléments de sont présents de cause à effet. Par exemple, si vous demandez à Sora de générer une vidéo dans laquelle le protagoniste mord dans un morceau de pizza ou enfonce un clou, il est probable que le sujet généré par l’IA croque dans la pizza ou prenne le marteau, mais il n’est pas certain que cela provoque un effet sur la pizza ou l’ongle représenté dans la vidéo.

Il semblerait en outre que le modèle fasse également a du mal à comprendre les invites qui contiennent des références spatiales, ce qui fait que Sora confond la gauche et la droite, ne lui permet pas d’effectuer des mouvements de caméra complexes, etc. De plus, les vidéos générées peuvent avoir le durée maximale d’une minute.

En ce moment Sora il n’a pas été rendu public. Seuls quelques utilisateurs sélectionnés (y compris des artistes visuels, des designers et des cinéastes) testent le modèle pour fournir à OpenAI des commentaires sur la façon de l’améliorer.

Quels sont les risques possibles associés à cette nouvelle application

Quand on parle d’IA générative, on ne peut s’empêcher de penser à l’IA risques possibles en utilisant des outils comme Sora. Être capable de créer des vidéos avec un tel niveau de réalisme peut représenter une opportunité pour les mauvais acteurs de faire quelque chose. désinformationpar exemple en diffusant de fausses nouvelles ou en diffamant des personnalités publiques, peut-être en utilisant la technique du faux profond (qui consiste à entraîner l’IA avec des images et des vidéos de visages réellement existants pour les « coller » sur le corps réel d’autres personnes) ou en créant à partir de rien des personnes qui n’ont jamais existé auparavant. C’est déjà arrivé et cela peut se reproduire.

C’est pourquoi OpenAI n’a pas encore publié Sora pour tout le monde. L’entreprise a en effet déclaré vouloir d’abord impliquer une équipe d’experts externes afin qu’ils puissent tester Sora en profondeur et identifier les potentiels problèmes critiques du modèle liés à la sécurité des utilisateurs. OpenAI travaille également sur un classificateur de détection ce qui vous permettra de comprendre quand une vidéo a été générée artificiellement avec Sora, ce qui devrait contribuer à atténuer les risques mentionnés ci-dessus.