ⓘ Cette page a été traduite à l'aide de l'intelligence artificielle.
Une image photoréaliste d'une vache surfant dans la mer et jubilant: cela a longtemps été impossible. Aujourd'hui, de tels sujets font déjà partie de notre quotidien. Cela est rendu possible grâce à l'IA générative et aux modèles de diffusion, qui peuvent construire une image pixel par pixel à partir d'une simple suggestion. Sur cette page, nous vous présentons des modèles connus, discutons des cas d'utilisation utiles et expliquons comment distinguer les images générées par l'IA des images réelles.
Aller directement au sujet
Partager la page
Comme pour l'IA textuelle, il existe de plus en plus de modèles d'IA générateurs d'images. GPT-4o et Midjourney sont actuellement les modèles les plus performants en termes de qualité.
Le «o» dans GPT-4o signifie «omni» et décrit le modèle d'OpenAI comme multimodal. Il peut donc traiter nativement (c'est-à-dire de manière autonome) du texte, des images et du son. GPT-4o peut générer des images, mais aussi les analyser ou en parler. Cela est particulièrement utile pour les tâches qui nécessitent les deux (comme la création d'une présentation). GPT-4o fonctionne depuis mars 2025 comme générateur d'images standard dans ChatGPT. Auparavant, le modèle de diffusion DALL·E (également développé par OpenAI) était utilisé pour la génération d'images depuis 2023.
Recommandé à partir de 13 ans
Web, application mobile, API pour développeurs
Essayer GPT-4o: https://chat.openai.com/ (ouvre une nouvelle fenêtre)
Midjourney est une IA générative spécialisée dans la génération d'images, et elle le fait très bien: cette IA est bien connue pour ses images de haute qualité et souvent surréalistes. Les paramètres disponibles offrent de nombreuses possibilités pour influencer et développer l'image lors de sa création. Le facteur communautaire joue également un rôle important chez Midjourney.
À partir de 13 ans
via Discord ou Midjourney Alpha
Essayer Midjourney (compte Discord ou Google requis): https://midjourney.com/home(ouvre une nouvelle fenêtre)
Pour les utilisateurs avancés: Midjourney Parameter(ouvre une nouvelle fenêtre)
Canva est une plateforme de conception très appréciée qui intègre également une fonctionnalité intelligente de génération d'images grâce à Magic Media. Elle met l'accent sur la simplicité d'utilisation et la possibilité d'intégrer directement les contenus dans les projets créés (flyers, stories pour les réseaux sociaux, candidatures, etc.).
Recommandé à partir de 13 ans
Web, application mobile
Essayer Canva AI: https://www.canva.com/ (ouvre une nouvelle fenêtre)
Adobe Firefly est le générateur d'images basé sur l'IA d'Adobe, intégré aux programmes de la suite Adobe Creative. Cette IA est guidée par des valeurs éthiques: selon les propres déclarations(ouvre une nouvelle fenêtre) du fournisseur, le premier modèle commercial Firefly a été entraîné à l'aide d'images Adobe Stock ainsi que d'œuvres et de contenus sous licence libre (ou dont les droits d'auteur ont expiré).
À partir de 13 ans (licence Adobe)
Adobe Creative Cloud, Web
Essayer Adobe Firefly: https://firefly.adobe.com/ (ouvre une nouvelle fenêtre)
Stable Diffusion a été publié en août 2022 en tant que modèle de génération d'images open source. Aujourd'hui, cette IA est souvent intégrée dans des programmes tiers tels que civitai.com ou leonardo.ai. Stable Diffusion offre un contrôle et une personnalisation maximaux, mais nécessite des connaissances techniques et est donc principalement utilisé par les professionnels du design.
En fonction de la plateforme utilisée
Application, Web, installations locales
Essayer Stable Diffusion en ligne: stablediffusionweb.com(ouvre une nouvelle fenêtre)
Quelle est la différence de qualité entre les générateurs d'images les plus connus lorsqu'ils exécutent la même commande?
« Style bande dessinée mignon, grand angle, éléphant en peluche serrant la main d'une souris, coucher de soleil, couleurs chaudes – format 16:9 »
La nouvelle génération de générateurs d'images basés sur l'IA fonctionne légèrement différemment de ses prédécesseurs: au lieu de se contenter de comprendre du texte, les modèles multimodaux «Omni» tels que GPT-4o peuvent traiter à la fois du texte, des images et du son. Cela ressemble à du multitâche, et c'est effectivement le cas. Mais cela ne concerne que l'IA: pour vous, l'utilisation devient plus simple et plus naturelle.
L'IA multimodale va au-delà du texte et des images (vidéo en allemand).
Ce que cela signifie pour tes invites:
Tu écris une invite textuelle (par exemple « Une pomme rouge sur une table ») et laisses l'IA générer une image.
Tu peux également télécharger une image d'une pomme rouge sur une table et demander à l'IA: «Rends la pomme bleue et ajoute une banane» ou «Crée une scène similaire, mais en hiver».
Avec les modèles multimodaux, il est devenu plus facile de peaufiner l'image de vos rêves à l'aide d'un exemple et en dialoguant avec l'IA. Contrairement aux générateurs d'images purs tels que DALL·E, les modèles multimodaux tels que GPT-4o peuvent se souvenir de l'historique des discussions et des versions précédentes de l'image, ce qui leur permet de modifier l'image de manière itérative et collaborative avec vous. Imaginez l'IA d'image comme un designer personnel que vous observez par-dessus son épaule tout en échangeant avec lui. Utilisez la fonction de dialogue si vous avez des questions sur le traitement de l'image pour obtenir des alternatives ou donnez un retour concret sur les résultats (j'aime ça, mais pas ça).
Petit bémol: les modèles multimodaux en sont encore à leurs balbutiements et ne sont parfois pas encore tout à fait au point. Il peut donc arriver que l'IA oublie certaines parties de l'image d'origine ou que tous les détails de l'image ne puissent pas être contrôlés pendant la conversation.
Une bonne consigne fournit des indications sur le style visuel, le contenu concret et le format (selon le modèle). Nous te dévoilons ici d'autres éléments à prendre en compte pour que l'IA génère les images que tu imagines.
Quelques principes à respecter au préalable: veillez à ne pas utiliser de mots de remplissage lorsque vous rédigez votre prompt. La longueur du prompt est essentielle, car les prompts plus longs aident l'IA à mettre en œuvre votre idée. Si vos instructions sont trop détaillées, l'IA peut se perdre et visualiser des éléments qui ne sont peut-être pas si importants pour vous.
Recherchez également des termes techniques issus des arts visuels(ouvre une nouvelle fenêtre) afin de pouvoir donner à l'IA des instructions stylistiques très concrètes.
Chaque IA générative fonctionne légèrement différemment. Mais pour toutes, il est utile de prêter attention à ces éléments fondamentaux:
Tous les générateurs d'images ne comprennent pas l'allemand. Renseigne-toi sur la langue parlée par le générateur d'images souhaité et formule ta requête dans cette langue. (Tu peux également te faire aider par un outil de traduction automatique tel que DeepL(ouvre une nouvelle fenêtre).)
Dans quel style l'image doit-elle être réalisée ? Souhaitez-vous un style artistique stylisé (comme les tableaux de Van Gogh) ou un motif photoréaliste ? Donnez à l'IA une tâche précise à accomplir.
Que voit-on exactement sur la photo? Qu'y a-t-il au premier plan, qu'y a-t-il à l'arrière-plan? Nomme tous les éléments nécessaires.
Dans quelle palette de couleurs l'image doit-elle être générée? Souhaitez-vous une image en noir et blanc ou une mise en scène colorée? D'où vient la lumière dans l'image? Quelle est l'ambiance qui se dégage de l'image?
Certains outils (comme Midjourney) vous permettent de définir vous-même le format de l'image, par exemple des portraits au format 3:4.
La génération d'images par IA peut faire bien plus que «simplement» favoriser l'expression artistique. Elle peut également t'aider dans ta vie quotidienne, en famille ou à l'école. De la décoration de ta chambre aux cours d'histoire, les possibilités sont plus variées que tu ne le penses.
Créer une carte de Noël avec l'IA (vidéo en allemand).
Tu cherches une nouvelle histoire pour endormir ton enfant? Grâce à des modèles multimodaux, tu peux créer ton propre livre d'images en toute simplicité. L'IA t'aide à faire émerger des idées et formule ton histoire comme tu le souhaites. Elle peut transformer tes croquis rapides en dessins de grande qualité pour illustrer ton livre. Elle peut également te donner des conseils utiles pour l'impression et l'organisation.
Tu souhaites donner un coup de frais à ton salon, peut-être avec un nouveau canapé? Une autre couleur pour les murs? Si tu ne sais pas comment t'y prendre ou si tu n'as pas d'idées, laisse l'IA s'en charger. Photographiez simplement votre salon et essayez différents meubles, couleurs ou styles d'aménagement avec l'IA avant de dépenser votre argent.
«Montre-moi le salon sur la photo téléchargée avec un canapé bleu ciel et des murs blancs immaculés.»
Que ce soit pour un anniversaire, Noël ou un mariage, l'IA te permet de créer des cartes personnalisées au lieu d'offrir des cartes standardisées. Remarque: pense à protéger tes données personnelles et réfléchis bien avant de télécharger des photos de toi ou d'autres personnes (demande leur accord au préalable) dans des IA.
Créer une carte de Noël (vidéo ci-dessus)
Comment expliquez-vous à vos élèves à quoi ressemblait réellement la vie au Moyen Âge? Les manuels scolaires peuvent parfois être arides et les images illustratives ne sont pas toujours disponibles. Laissez l'IA reconstituer des scènes historiques et discutez-en avec vos élèves en classe:
«À quoi ressemblait cette ville à l'époque par rapport à aujourd'hui?»
Les processus microbiologiques se déroulent à très petite échelle et ne sont généralement pas visibles à l'œil nu. Une IA peut toutefois zoomer très près d'une cellule végétale et rendre visibles des choses invisibles. À l'inverse, elle peut également rendre tangible quelque chose d'incroyablement grand, comme l'évolution de l'être humain en accéléré.
«Montre-moi à quoi ressemble une cellule végétale de l'intérieur.»
Les images pédagogiques peuvent être particulièrement utiles pour les apprenants visuels dans l'apprentissage des langues, plutôt que de simples fiches de vocabulaire. L'IA illustre les mots de vocabulaire et crée des scènes appropriées ou des moyens mnémotechniques qui facilitent leur mémorisation.
«A happy dog plays in the park.»/«Une famille française au petit-déjeuner.»
Bien sûr, l'IA peut également aider à transmettre des compétences médiatiques, par exemple en générant des images IA et en les donnant aux enfants à trier avec des photos.
«Comment distinguer les photos réelles des images générées par l'IA ?»/«Quelles sont les erreurs typiques de l'IA?»/«Comment identifier correctement les contenus générés par l'IA ?»/«Quelles sont les implications pour le journalisme et la diffusion de l'information?»
Les concepts abstraits sont souvent difficiles à imaginer. L'IA peut y remédier et esquisser rapidement des idées (sans investissement financier important). Elle peut également aider à créer des moodboards et les compléter avec des images générées par l'IA. Parfois, l'IA aide à surmonter les blocages créatifs en remplissant la page blanche avec une première idée. Tu gagnes ainsi plus de temps pour finaliser la meilleure idée.
«Crée un moodboard pour un design d'emballage de café bio dans un style scandinave.»
Générer en permanence du nouveau contenu pour ton entreprise demande beaucoup de temps. Laisse l'IA t'aider. Un modèle multimodal t'accompagne aussi bien dans la conception que dans les premières visualisations. Certaines entreprises du secteur de la mode misent déjà entièrement sur des contenus générés par l'IA dans le cadre de campagnes à grande échelle.
«Crée une deuxième variante d'image afin de réaliser un test A/B. Utilise des couleurs plus vives et des perspectives dynamiques pour la deuxième variante.»
Les diapositives PowerPoint ennuyeuses avec des cliparts standard ne convainquent plus vraiment personne aujourd'hui. Mais les graphiques professionnels sont parfois tout simplement trop chers. L'IA vous offre souvent le juste milieu et crée des graphiques et des diagrammes selon vos goûts.
«Générez une icône en noir qui symbolise le travail d'équipe.»/«Visualisez notre processus de transformation en intégrant et en reliant les aspects suivants:…»
Si vous souhaitez utiliser des contenus générés par l'IA à des fins commerciales, renseignez-vous au préalable sur les droits d'utilisation et les conditions de protection des données des modèles. Pour des raisons éthiques et juridiques, identifiez clairement les contenus générés par l'IA comme tels. Respectez bien sûr également les éventuelles directives en matière de design d'entreprise. Et considérez l'IA comme un complément, mais pas comme un substitut aux capacités et à la créativité humaines.
Savoir reconnaître les images générées par l'IA devient une compétence médiatique importante. Nous te montrons ici ce à quoi tu dois faire attention et ce que tu peux faire si tu n'es pas sûr. Avec un peu de pratique, tu développeras un bon instinct. Reste toutefois vigilant, car les technologies s'améliorent chaque jour.
Ce qui vaut pour la détection des deepfakes vidéo aide généralement aussi à démasquer les images générées par l'IA. Mais cela n'est pas pour autant simple. Même les experts se trompent parfois. Il est donc tout à fait normal d'avoir des doutes. L'important est de rester critique et de faire des recherches en cas d'incertitude.
Oui, certaines IA d'images ont encore du mal à représenter correctement les mains et les doigts. Faites particulièrement attention aux bijoux: les bagues ont souvent tendance à se fondre de manière peu naturelle avec les mains.
Regarde les détails: comment sont disposées les dents? Sont-elles trop parfaites ou alignées de manière peu naturelle? À quoi ressemble la peau? Présente-t-elle des transitions étranges? Qu'en est-il des pupilles? Les yeux semblent-ils vivants ou sans vie? Les yeux des images générées ont souvent un regard fixe.
Même si les choses s'améliorent progressivement, certaines IA d'image ont encore des difficultés à afficher correctement et lisiblement les textes. Les mots n'ont alors parfois aucun sens ou les panneaux affichent des langues imaginaires.
Faites également attention aux reflets dans les fenêtres ou sur les surfaces: sont-ils corrects? D'où vient la source lumineuse et y en a-t-il une? Les ombres correspondent-elles à la direction de la source lumineuse?
Recherche l'image en question dans la recherche (inverse) de Google afin de déterminer où elle est utilisée ailleurs. Cela peut te donner des indices sur l'origine de l'image.
Dans le monde entier, des entreprises technologiques de premier plan telles qu'Adobe, Intel ou Microsoft s'engagent de plus en plus pour que l'origine des contenus multimédias puisse être certifiée à l'aide de filigranes. Peut-être que ta photo est certifiée ?
En règle générale, ne vous fiez pas à une seule caractéristique, mais vérifiez plutôt plusieurs aspects. Restez particulièrement sceptique face aux images parfaites.
Outre les vidéos, les deepfakes existent également sous forme d'images. C'est le cas lorsque des éléments d'une image sont remplacés à l'aide d'une IA générative, de sorte que le message change, mais que l'image reste d'un réalisme trompeur. Dans le cas des images, le droit d'auteur est également un sujet très controversé.
En tant qu'enseignant, vous êtes confronté à la question suivante: dois-je utiliser l'IA visuelle pour préparer mes cours ou pendant ceux-ci, et si oui, comment ? Comme souvent, la règle suivante s'applique ici aussi: bien sûr, profitez des opportunités offertes par les nouvelles technologies, mais soyez également conscient de leurs limites et de leurs risques. Vous pourrez ainsi prendre vos propres décisions et contribuer activement à développer les compétences médiatiques de vos élèves.
Comment expliquer à un enfant du cycle I comment fonctionne un panneau solaire ? Ou comment une plante effectue la photosynthèse ? Les modèles multimodaux sont particulièrement efficaces pour représenter visuellement des fonctionnements et des relations complexes, et les expliquer à un certain âge. Alors que GPT-4o peut utiliser la métaphore parlante d'une usine pour expliquer le fonctionnement d'un panneau solaire, le générateur d'images intégré complète les explications avec une illustration appropriée.
Grâce à cette aide, tu disposes rapidement d'images adaptées pour préparer tes cours, sans avoir à payer de droits d'auteur (ni à te prendre la tête).
Une image vaut mille mots, surtout lorsque ces mots ne font pas encore partie de notre vocabulaire. C'est le cas, par exemple, lorsque l'on enseigne à des enfants qui ne parlent pas couramment l'allemand. Ou encore lorsque les concepts fondamentaux liés au matériel pédagogique sont très abstraits. Les images, les graphiques et les schémas visuels peuvent alors aider à rendre le sujet compréhensible pour tous.
Si vous générez des représentations historiques ou scientifiques à l'aide de l'IA visuelle et que vous les intégrez dans votre cours, précisez clairement que vous avez utilisé l'IA. Précisez également qu'il ne s'agit pas de représentations historiquement ou scientifiquement correctes, mais plutôt d'approximations visuelles du sujet qui n'ont pas nécessairement existé sous cette forme. Il est possible de discuter directement en classe des raisons pour lesquelles les images générées diffèrent des images historiques réelles et des endroits où ces différences apparaissent.
Sachez également que les représentations générées par l'IA peuvent renforcer les stéréotypes (car une IA générative reproduit toujours des modèles répandus et appris) lorsque vous représentez des groupes culturels, par exemple.
Bien sûr, l'IA visuelle peut être très utile pour illustrer visuellement des concepts complexes. Mais elle prend alors le relais de la réflexion des élèves, en particulier de leur imagination créative.
C'est comme lorsque tu regardes un film avant d'avoir lu le livre : si tu veux quand même lire le livre après, tu as automatiquement en tête les acteurs du film au lieu de te faire ta propre image d'eux. Sois donc conscient du pouvoir des images et du fait que tu influences l'imagination des élèves.
Dans ce cours, les enseignants découvrent les générateurs d'images IA et apprennent ce qui se passe en arrière-plan dès que les requêtes sont envoyées. Nous abordons les questions suivantes: où et comment les générateurs d'images peuvent-ils être utilisés dans l'enseignement? Comment aborder la réalité, la manipulation et la responsabilité dans le cadre de la génération d'images en classe? Ce webinaire de 90 minutes a été développé en collaboration avec LerNetz.
Nous avons réuni ici d'autres informations et contenus sur le thème "IA d'images et générateurs d'images".
Marcel est formateur chez Swisscom. Il est à votre disposition pour toutes les questions autour de l’IA.
Formateur chez Swisscom
Thème
Comment fonctionnent les IA d'images?
Pour générer des images, l'intelligence artificielle dispose de deux méthodes différentes: d'une part, les réseaux antagonistes génératifs (GAN) et, d'autre part, les modèles de diffusion. Mais que se cache-t-il derrière ces termes?
GANs
Les réseaux antagonistes génératifs (GAN) ont été la technologie de génération d'images par IA la plus utilisée ces dernières années. Dans un GAN, un générateur d'images entraîné selon l'approche du deep learning crée une image en une seule étape.
C'est avec ce générateur d'images que la méthode GAN est devenue populaire en 2014: https://thispersondoesnotexist.com(ouvre une nouvelle fenêtre)
La faiblesse des GAN réside dans le fait que, même lorsque les conditions de départ sont différentes, la même image peut être générée deux fois, car la technique favorise cela.
Modèles de diffusion
Les modèles de diffusion suivent une approche différente de celle des GAN: en 2021, des chercheurs de la société OpenAI ont proposé dans leur article «Diffusion Models Beat GANS on Image Synthesis» les modèles de diffusion comme nouvelle technique améliorée pour la génération d'images.
La différence pertinente dans le processus réside dans les étapes itératives des modèles de diffusion, qui permettent d'éviter les doublons et d'obtenir un niveau de détail plus élevé. La technique de diffusion s'est aujourd'hui imposée dans tous les outils courants de génération d'images.
Images générées par l'IA et droit d'auteur:
ce que vous devez savoir
Lorsque des images sont créées à l'aide de l'IA, la situation juridique est intéressante : actuellement, elles ne sont en principe pas protégées par le droit d'auteur en Suisse, ce qui rend leur utilisation flexible. Néanmoins, les droits des marques et les droits de la personnalité doivent être pris en compte. Les évolutions rapides de la technologie pourraient entraîner des changements dans le droit d'auteur à l'avenir. Reste informé pour rester à jour.
En savoir plus