OpenAI lance «Sora»Une interface capable de générer des vidéos plus vraies que nature
ATS
16.2.2024 - 05:02
OpenAI a annoncé jeudi le lancement, auprès d'un public restreint, d'une nouvelle interface d'intelligence artificielle (IA) générative. Baptisée Sora, elle est capable de créer des séquences vidéo sur simple demande sous forme de texte en langage courant.
Keystone-SDA
16.02.2024, 05:02
16.02.2024, 06:32
ATS
La start-up de San Francisco n'est pas la première à proposer un logiciel vidéo qui s'appuie sur l'IA générative. Une autre jeune société, Runway, a lancé Gen-2 en juin, avec des séquences de quelques secondes, tandis que Google prépare Lumiere et Meta, Emu, qui ne sont pas encore accessibles à des utilisateurs tiers.
A en croire la description du logiciel et des exemples présentés sur le site d'OpenAI, Sora apparaît comme l'interface disponible la plus aboutie à ce jour. A partir d'une requête simple, demandant «des images de la Californie durant la ruée vers l'or», Sora a livré un film d'une ville typique du XIXe siècle, comme tourné au drone, qui ressemble à des images d'archives.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Un autre montre une femme japonaise marchant dans une rue de Tokyo, avec des changements d'angles de caméra. Elle est longue d'une minute, la durée maximum que permet Sora en l'état. Seuls ont, pour l'heure, accès à l'interface des «experts de domaine comme la désinformation, les contenus à caractère haineux et les biais».
Prolonger les films existants
Ils vont tester le modèle de façon «adversariale», c'est-à-dire en lui demandant de créer des contenus qui sont théoriquement jugés inacceptables. OpenAI souhaite ainsi se servir de ce retour d'expérience pour fixer des garde-fous à Sora, afin qu'il «rejette des demandes qui sont contraires à nos règlements, notamment celles qui comprennent de l'extrême violence, du sexe, des images haineuses, des célébrités ou du contenu protégé par le droit de la propriété intellectuelle».
Le créateur de ChatGPT a également donné accès à des artistes visuels, des designers et des réalisateurs pour mieux comprendre «comment travailler à ce que le modèle soit le plus utile pour les professionnels de la création». A même de générer une vidéo grâce à une demande écrite, Sora peut aussi le faire à partir d'une image. L'interface est, de même, en mesure de produire une séquence qui va prolonger la durée d'un film existant ou de reconstituer d'éventuels passages manquants d'une vidéo.