24 Comment l’IA peut aider la création vidéo � Chez OpenClassrooms, nous utilisons différents types de formats vidéo : vidéo explicative dans nos cours, vidéos de mise en scène dans nos projets, interview d’expert, etc. La création vidéo requiert un certain nombre d’étapes que chaque équipe d’ingénierie pédagogique multimédia connaît également. En matière de multimédia, notre conviction reste que créer est toujours le fruit d’une pensée ou d’une démarche artistique, dont nous, en tant qu’humains, restons les auteurs. Les différentes IA génératives restent, comme pour la création pédagogique, des outils pour faciliter le quotidien et non remplacer le travail des experts. Créer�des�scripts�vidéos Pour maîtriser le discours des experts lors des tournages des vidéos et ainsi assurer la meilleure qualité pédagogique possible, nous avons décidé depuis plusieurs années de scripter l’ensemble des contenus. → Un script vidéo doit respecter certaines règles, notamment : – une structure claire et définie, comme une bonne accroche et une bonne conclusion avec un appel à l’action ; – un contenu clair et concis, avec un vocabulaire accessible et des phrases courtes, pour faciliter la compréhension ; – ton engageant, avec un texte qui sonne naturel lorsqu’il est parlé à haute voix ; – une longueur définie. ASTUCE : Toutes ces caractéristiques sont à partager à ChatGTP dans la rédaction de scripts, pour qu’il puisse les prendre en compte dans sa rédaction. Une fonctionnalité, gratuite, peut s’avérer très utile : les « custom instructions ». Ce sont des paramètres spécifiques qui sont intégrés dans ChatGTP pour guider ses réponses. Ces instructions sont conçues pour aider l’outil à répondre de manière plus appropriée et précise à certaines demandes. Pour en savoir plus sur la création de ces custom instructions, vous pouvez regarder la vidéo dédiée du Youtubeur Ludo Salenne..
25 → Avant toute demande de rédaction de scripts, il est important de donner à ChatGPT plusieurs instructions : – le rôle qu’il doit endosser (par exemple celui d’un scénariste) ; – le type de vidéo pour laquelle il faut créer un script ; – les règles de rédaction à respecter ; – la cible à qui il s’adresse. Habituellement, c’est l’ingénieur pédagogique qui va rédiger ces scripts vidéos à partir des éléments pédagogiques clés du chapitre, qu’il aura au préalable identifiés avec son expert. Ici, ChatGPT va l’aider à rédiger un premier brouillon sur lequel réitérer. Dans ce cas de figure, nous lui partageons les notions pédagogiques essentielles identifiées avec l’ex- pert et nous lui demandons de rédiger un premier script. Il prend en compte les contraintes techniques et stylistiques. Le premier brouillon n’est jamais très bon, mais cela fait une bonne base de travail. En général, une première structure s’en dégage (ou à défaut, la structure proposée fait penser à une autre structure qui aurait plus de sens). Lors de la formulation d’une seconde demande, demandez-lui de prendre en compte la structure retenue dans le déroulement de son script. → Exemple de prompt initial : LE PROMPT : Tu es scénariste et tu rédiges un script pour une vidéo pédagogique. La vidéo s’adresse à [des étudiants en …] qui découvrent le sujet de […]. Voici les concepts clé à couvrir [liste des concepts]. Le contenu doit être clair et précis, avec un vocabulaire accessible pour des débutants. Si tu dois utiliser un terme complexe, explique-le. Rédige le script intégralement, avec un ton neutre. La vidéo doit durer 2 minutes. ASTUCE : Certains paragraphes vont nous convenir, d’autres moins. Il va alors falloir réitérer vos demandes en lui copiant/collant les paragraphes qui vous ont plu, pour que l’IA puisse s’inspirer du style, jusqu’à obtenir un script quasi fini et qui répondra entièrement à vos attentes. Enfin, il est souvent pertinent d’ajouter une petite touche personnelle, avec des corrections et d’éven- tuelles reformulations..
26 Générer�des�idées�visuelles La question de la génération d’image fait partie des sujets parmi les plus visibles depuis l’émergence de l’IA dans le multimédia. Le simple fait d’arriver à créer, à partir d’un prompt, une image d’une qualité professionnelle a complètement transformé la façon d’appréhender cette technologie chez les créatifs. L’IA donne ainsi la possibilité à ceux qui n’ont pas les compétences techniques de créer une image. Toute la subtilité réside encore une fois dans le fait d’apprendre à formuler (prompt engineering) et de savoir verbaliser sa requête, peu importe l’outil. → Faire ressortir des éléments graphiques à partir du script En conception de vidéo pédagogique, il est bien souvent nécessaire d’ajouter des éléments de motion design pour appuyer le discours d’un expert, aider la compréhension d’un concept complexe, aider l’apprenant à visualiser… Il est possible d’utiliser les IA génératives en phase de réflexion sur la création d’éléments visuels. Par exemple, sur un cours abordant la démarche d’achat durable, une des phrases du script était : « Les problématiques économiques, environnementales et sociales sont liées et doivent être abordées de manière intégrée et cohérente. » Voyons comment demander à ChatGPT des idées d’illustration. LE PROMPT : Tu es ingénieur pédagogique et tu travailles actuellement à la création d’une vidéo pédagogique. Tu aimerais intégrer des éléments de motion design à la vidéo. Voici un passage qu’il faudrait rendre visuellement explicite « Les problématiques économiques, environnementales et sociales sont liées et doivent être abordées de manière intégrée et cohérente ». Donne-moi un exemple d’illustration..
27 LA RÉPONSE DE CHATGPT : Scène : Fond : - Utilisez une représentation stylisée de la Terre en arrière-plan pour symboliser l’environnement. Éléments visuels : - Trois icônes principales : une pièce de puzzle pour l’économie, une feuille verte pour l’environnement, et des silhouettes humaines pour le social. Animation : - Faites apparaître ces trois icônes de manière séquentielle, chacune à un coin différent de l’écran. - Ensuite, des lignes connectent ces icônes, formant un triangle pour montrer leur interconnexion. Évolution : - Ajoutez des animations pour indiquer des interactions dynamiques entre ces icônes. - Par exemple, des flèches bidirectionnelles montrant comment des actions dans un domaine peuvent influencer les deux autres. Message Textuel : - Intégrez du texte à l’écran, comme « Interconnexion » ou « Influence réciproque », pour renforcer le message. À l’ingénieur pédagogique bien sûr d’analyser la proposition, de juger de sa pertinence et éventuelle- ment d’itérer et de proposer de nouvelles idées - nous pourrions demander ici de remplacer les icônes proposées par des rouages, des piliers etc. ASTUCE : Vous pouvez également demander à ChatGPT de vous aider à identifier les passages de script qui pourraient être animés..
28 → Fournir des ébauches sans compétences techniques Comme de nombreuses structures spécialisées dans l’ingénierie pédagogique, les ingénieurs péda- gogiques d’OpenClassrooms travaillent main dans la main avec les équipes graphiques. L’IA générative a permis de faciliter les échanges entre ces équipes, en permettant de créer rapidement et facilement des visuels qui servent de première visualisation. Cette étape facilite les échanges entre équipes et limite les possibles décalages d’interprétation. Il n’est alors plus nécessaire de créer les ébauches de visuels ou de les décrire longuement à l’équipe multimédia pour qu’elles prennent forme. Nous gagnons, avec les outils comme Midjourney, Dall-E et bien d’autres, une première approche accessible à tous qui, s’affranchissant de devoir verbaliser correctement son souhait ou ses attentes, permet de casser la barrière du glossaire « métier » et d’offrir une première visualisation de l’attendu, qui sera par la suite retravaillé par les équipes multimédia. Lorsque vous créez des prompts pour générer des images, pensez à donner des directives de style afin de générer une image proche de vos attentes. Précisez notamment le format attendu [un schéma, une photo, une illustration à la manière de…], S’il s’agit d’une ébauche simple, précisez-le. ASTUCE : De manière générale, il est recommandé à ceux qui ne sont pas encore habitués à l’utilisation des requêtes sur le logiciel Discord (une interface de chat utilisée notamment par MidJourney pour envoyer des requêtes de création, mais avec des codes et paramétrages complexes à connaître) d’utiliser des IA avec des interfaces simples type Lumenor.ia ou Dreamstudio.ia. Nul doute que les outils évolueront par la suite vers des interfaces plus faciles à utiliser même sans compétences techniques. → Voici un exemple de prompt simple, pour générer une image sur Dreamstudio.ia : LE PROMPT : Créer le schéma d’un cerveau de profil. Garder un style simple. Colorer les différentes aires du cerveau..
29 LA RÉPONSE DE CHATGPT : Cette première image servira de base et permettra de montrer à une équipe multimédia ce que l’in- génieur pédagogique attend comme illustration au sein de sa vidéo par exemple. ATTENTION, un outil tel que DALL.E peut très rapidement créer une image parfois très complexe, loin de l’aspect schématique attendu. Précisez bien le style attendu et itérez si nécessaire. Et gardez également à l’esprit que ces IA génèrent encore très mal le texte (si vous demandez des légendes par exemple, DALL.E, Midjouney ou Lumeor.ia généreront un texte aléatoire et incohérent)..
30 Travailler�la�forme� (scénographie, fond...) Faisons à présent un focus sur le tournage vidéo en tant que tel. La création vidéo a évolué très na- turellement avec la technologie disponible. À l’origine, notre travail sur la forme et la scénographie, visant à donner une identité visuelle forte, nécessitait des efforts dans la mise en place et dans la post-production ensuite. En travaillant ainsi, le travail de scénographie était difficilement remplaçable car il demandait une logistique lourde. Nous avons donc travaillé à créer des fonds artificiels. Il devient alors possible de passer d’une scé- nographie à l’autre à l’aide d’un projecteur, et de simuler artificiellement un espace derrière le sujet en jouant sur son éclairage. Ce qui était impensable auparavant tant ceci demandait de temps en matière de scénographie, d’infographie 3D, d’illustration ou de photographie, est rendu possible grâce aux IA génératives. ATTENTION cependant : la pré-production est lourde et demande plusieurs préconfigurations. La scénographie et la forme sont plus variées mais aller au-delà demanderait encore beaucoup de travail..
31 La démarche complète pourrait consister à l’utilisation d’un outil comme DALL-E (intégré à ChatGPT4 et très simple d’utilisation) pour produire des intentions de fonds ou de visuels en un temps record, qui puissent être adaptés au thème de la vidéo, à la difficulté du cours, etc. Notre modèle consiste à d’abord réfléchir aux besoins pédagogiques que nous cherchons à remplir, que nous traduisons en caractéristiques scénographiques. Il est très important pour une équipe pédagogique de partir de ces besoins étudiants. Ce n’est qu’ensuite que viendra la phase de travail avec les outils d’IA génératives avancés comme MidJourney (actuellement dans sa version 6) et sur lequel nous itérons jusqu’à attein- dre l’objectif de qualité souhaité. Fond généré par une IA (ci-dessous le prompt utilisé et ses paramètres).
32 → Exemple de prompt sur MidJourney : LE PROMPT : image/ a perfect picture inspired by the picture in this link, with the same point of view, with the same atmosphere inspired by the forms and the colors. Ultra detailed 4K resolution, ultra realistic rendering sunny atmosphere. Ultra modern style Paramètres additionnels : no pets. No humans. No characters. Ar 16:9 On remarque que pour la génération d’images plus artistiques que les ébauches vues précédemment, le travail de description dans le prompt est particulièrement important. ASTUCE : Si vous voulez faire parler votre créativité, vous pouvez notamment demander des images « à la manière de » [un artiste, une oeuvre], dans un style particulier [une photo, une illustration, un comic], un mouvement artistique [impressionniste, surréaliste], une technique particulière [en aquarelle, en croquis], une période [baroque, Renaissance, futuriste] ou encore en référence à des pays et des styles artistiques [estampes japonaise, art tribal africain]... Cet exemple sur la scénographie et le fond vidéo n’est qu’une possibilité parmi d’autres (doublage, création de vidéos…) ouvertes par les outils d’IA génératives..
33 Comment l’IA permet d’optimiser la qualité sonore des productions � Qui n’a jamais été interpellé par un tic verbal, un bruit de bouche, une respiration monotone durant le visionnage d’un cours ? Lorsqu’il faut retravailler l’audio (d’une vidéo, d’un screencast etc.), la post-pro- duction peut s’avérer extrêmement lourde. Or, il est important pour l’étudiant de pouvoir se concentrer sur une voix propre et claire durant un cours. Pour ce qui est du face caméra en particulier, les étudiants ont besoin qu’il soit dynamique, clair et dépourvu de tic ou de bruit perturbateur. Jusqu’ici, tous ces paramètres étaient gérés par deux aspects techniques et technologiques : la qualité des prises de sons et le matériel pour les réaliser. Tous les enregistrements devaient alors se faire sans bruit, sans perturbation extérieure. Depuis le développement de l’IA ont émergé des algorithmes et des outils de normalisation absolument phénoménaux. – Google intègre déjà dans ses nouveaux téléphones (les modèles « Pixels ») la possibilité de supprimer les bruits parasites, d’isoler une voix ou un son. – Chez OpenClassrooms, nous utilisons des logiciels comme iZotope RX9 (bien moins cher que le matériel physique) qui, grâce à une part d’IA et d’algorithmes, permettent d’utiliser un tournage vidéo malgré des défauts de prise de son par exemple. – Adobe Podcast (entièrement gratuit) ou ai-coustics, une IA générative redoutable pour la restauration, permettent plus généralement d’améliorer le son des vidéos. Cela constitue un vrai changement dans la gestion de l’incertitude en tournage : bruits, travaux, souffles… l’IA saura supprimer tout cela en post-production, pas nécessairement mieux qu’une équipe multimédia, mais en un temps bien plus réduit. Un gain de productivité important pour une équipe multimédia, qui peut alors se concentrer sur des tâches avec davantage de valeur ajoutée..
34 Conclusion Ce guide a pour objectif de montrer, à chaque étape de conception pédagogique, l’intérêt et la collaboration potentielle entre les outils d’IA génératives et les ingénieurs pédagogiques, afin de faciliter les processus de création. L’IA générative est une technologie en constante évolution. Les éléments présentés dans ce guide sont susceptibles d’évoluer rapidement et nous en sommes conscients. Certains des freins rencontrés aux débuts de nos essais ont par exemple été réglés lors de dernières mises à jour. Ainsi, avant les mises à jour récentes, ChatGPT avait une limite de connaissances en 2021, ce qui posait inévitablement des problèmes (données d’entraînement obsolètes ou non fiables sur certains domaines qui évoluent rapidement). Aujourd’hui, les données d’entraînement sont plus récentes et donc généralement plus fiables. Il est tout de fois primordial de rester vigilants face à toutes les limites que nous connaissons (hallucinations, biais, etc.). Les différents chapitres ont également montré que, lorsque l’on souhaite un livrable de qualité de la part de ChatGPT, cela demande du travail de préparation et de prompt engineering en amont. L’ensemble des exemples présentés dans ce guide a demandé des heures de travail, d’essais, d’améliorations… Les prompts utilisés en interne sont retravaillés selon les besoins de l’entreprise. Il peut être intéressant de passer du temps à créer des modèles de prompts qui seront réutilisés pour des tâches répétitives et qui feront, par la suite, gagner du temps au quotidien. Ces différents chapitres s’accordent tous sur un point : l’IA générative permet de créer plus facilement et plus rapidement, mais il s’agit toujours de premières versions à retravailler. Le niveau de qualité reste acceptable mais bien en-deçà de ce qu’un expert en pédagogie saura créer. Même bien formalisé, le résultat proposé par ChatGPT ne sera pas utilisable en l’état ; c’est en tout cas ce que nous pensons à OpenClassrooms, au regard de nos critères qualité. Il est toutefois indéniable que ces nouveaux outils permettent de libérer du temps pour des améliorations à haute valeur ajoutée. En disposant de ce temps supplémentaire, l’ingénieur pédagogique est invité à penser « expérience d’apprentissage » avant tout en remplacement de certaines étapes de conception à faible valeur ajoutée..
35 Glossaire → Prompt : Signifiant « instruction », un prompt sert à guider la génération de texte par l’IA. Savoir faire un prompt, c’est savoir entrer une instruction claire sur le texte à générer, pour atteindre l’objectif visé. Pas besoin de savoir programmer, mais il faut savoir « bien » parler à l’IA, en anglais ou en français. Source → Prompt engineering : On peut résumer le prompt engineering comme « L’art de savoir poser les bonnes questions ». C’est une technique qui consiste à rédiger des amorces ou des instructions (en anglais, prompts) pour guider la génération de texte par l’IA. Source.
)PENCLASSROOMS.