Sora, le dernier de la famille OpenAI
Pour aller toujours plus loin dans la génération de contenu par intelligence artificielle, il ne manquait que la vidéo !
Sora propose “une véritable révolution” : l’outil permet de générer une vidéo d’une durée de maximum 60 secondes, dans un style allant du dessin animé à l'ultra réalisme, à partir d’un simple texte. L'objectif est de donner vie facilement à toutes les idées.
La page dédiée à cette nouveauté technologique présente quelques exemples de réalisations générées par IA, et les résultats sont surprenants : “Sora est capable de générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis du sujet et de l'arrière-plan. Le modèle comprend non seulement ce que l'utilisateur a demandé dans l'invite, mais également comment ces choses existent dans le monde physique”, source : OpenAI.
Sora propose “une véritable révolution” : l’outil permet de générer une vidéo d’une durée de maximum 60 secondes, dans un style allant du dessin animé à l'ultra réalisme, à partir d’un simple texte. L'objectif est de donner vie facilement à toutes les idées.
La page dédiée à cette nouveauté technologique présente quelques exemples de réalisations générées par IA, et les résultats sont surprenants : “Sora est capable de générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis du sujet et de l'arrière-plan. Le modèle comprend non seulement ce que l'utilisateur a demandé dans l'invite, mais également comment ces choses existent dans le monde physique”, source : OpenAI.
Un outil bientôt accessible au grand public ?
Si l’idée d’un tel outil en fait déjà rêver plus d’un, il faudra encore un petit peu pour profiter de ses services. En effet, Sora est actuellement dans une phase expérimentale. L’entreprise OpenAI a annoncé ne donner accès à la plateforme qu’à un nombre limité d’utilisateurs, afin d’obtenir des retours sur les potentiels problèmes et risques de l’outil. C’est également l’opportunité de continuer à améliorer l’outil afin d’en faire un véritable outil de production audiovisuelle. Après plusieurs tests en interne, OpenAI ouvre l’outil à des personnes en externes afin de mieux cerner les capacités de l’outil avant son ouverture au grand public.
L’entreprise précise que pour l’instant, “lle modèle actuel présente des faiblesses. Il peut avoir du mal à simuler avec précision la physique d’une scène complexe et ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut mordre dans un cookie, mais par la suite, le cookie peut ne pas avoir de marque de morsure.”
“Le modèle peut également confondre les détails spatiaux d'une invite, par exemple en mélangeant la gauche et la droite, et peut avoir du mal à décrire avec précision les événements qui se déroulent au fil du temps, comme suivre une trajectoire de caméra spécifique.” explique l’entreprise, qui illustre d’ailleurs ses propos par des exemples de “vidéos ratées”.
L’entreprise précise que pour l’instant, “lle modèle actuel présente des faiblesses. Il peut avoir du mal à simuler avec précision la physique d’une scène complexe et ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut mordre dans un cookie, mais par la suite, le cookie peut ne pas avoir de marque de morsure.”
“Le modèle peut également confondre les détails spatiaux d'une invite, par exemple en mélangeant la gauche et la droite, et peut avoir du mal à décrire avec précision les événements qui se déroulent au fil du temps, comme suivre une trajectoire de caméra spécifique.” explique l’entreprise, qui illustre d’ailleurs ses propos par des exemples de “vidéos ratées”.
Création de vidéo et sécurité
OpenAI mettra en œuvre plusieurs mesures de sécurité clés avant d'intégrer Sora dans ses produits. Cela comprend la collaboration avec des équipes composées d'experts dans des domaines tels que la désinformation, les contenus haineux et les préjugés, qui évalueront le modèle..
En préparation pour le déploiement, OpenAI tire parti des techniques de sécurité qu'elle a mises au point pour ses produits utilisant DALL·E 3, qui sont également applicables à Sora.
Par exemple, dans un produit OpenAI, un classificateur de texte sera utilisé pour examiner et refuser les commandes qui violent les politiques d'utilisation de l'entreprise, telles que les demandes impliquant une violence extrême, du contenu sexuel, des images haineuses, la ressemblance avec une célébrité, ou la divulgation d'informations personnelles. Des classificateurs d'images sophistiqués sont également en place pour vérifier que les images de chaque vidéo produite respectent les normes d'utilisation avant d'être présentées aux utilisateurs.
OpenAI engagera des discussions avec des décideurs politiques, des éducateurs et des artistes du monde entier pour saisir leurs inquiétudes et identifier des applications positives de cette nouvelle technologie. Malgré des recherches et des tests approfondis, il est impossible de prévoir toutes les utilisations bénéfiques ou abusives de la technologie. C'est pourquoi OpenAI considère que comprendre l'utilisation réelle est crucial pour développer et partager des systèmes d'IA de plus en plus sécurisés au fil du temps.
En préparation pour le déploiement, OpenAI tire parti des techniques de sécurité qu'elle a mises au point pour ses produits utilisant DALL·E 3, qui sont également applicables à Sora.
Par exemple, dans un produit OpenAI, un classificateur de texte sera utilisé pour examiner et refuser les commandes qui violent les politiques d'utilisation de l'entreprise, telles que les demandes impliquant une violence extrême, du contenu sexuel, des images haineuses, la ressemblance avec une célébrité, ou la divulgation d'informations personnelles. Des classificateurs d'images sophistiqués sont également en place pour vérifier que les images de chaque vidéo produite respectent les normes d'utilisation avant d'être présentées aux utilisateurs.
OpenAI engagera des discussions avec des décideurs politiques, des éducateurs et des artistes du monde entier pour saisir leurs inquiétudes et identifier des applications positives de cette nouvelle technologie. Malgré des recherches et des tests approfondis, il est impossible de prévoir toutes les utilisations bénéfiques ou abusives de la technologie. C'est pourquoi OpenAI considère que comprendre l'utilisation réelle est crucial pour développer et partager des systèmes d'IA de plus en plus sécurisés au fil du temps.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf