Un'immagine fotorealistica di una mucca che fa surf nel mare e esulta: per molto tempo è stata una cosa impossibile. Oggi, soggetti di questo tipo fanno già parte della nostra quotidianità. Il merito va alle IA generative per immagini e ai modelli di diffusione, in grado di costruire un'immagine pixel per pixel sulla base di un prompt. In questa pagina vi chiediamo di segnalarci modelli noti, parliamo di casi d'uso utili e di come distinguere le immagini generate dall'IA da quelle reali.
Direttamente al tema
Condividi la pagina
Per generare immagini, l'intelligenza artificiale ha a disposizione due metodi diversi: da un lato le reti generative avversarie (GAN) e dall'altro i modelli di diffusione. Ma cosa si nasconde dietro questi termini?
Le reti generative avversarie (GAN) sono state la tecnologia leader nella generazione di immagini basata sull'intelligenza artificiale negli ultimi anni. In una GAN, un generatore di immagini addestrato con l'approccio del deep learning crea un'immagine in un unico passaggio.
Con questo generatore di immagini, il metodo GAN è diventato popolare nel 2014: https://thispersondoesnotexist.com/(apre una nuova finestra)
Il punto debole delle GAN è che, anche con condizioni di partenza diverse, è possibile generare due volte la stessa immagine, perché la tecnica lo favorisce.
I modelli di diffusione seguono un approccio diverso rispetto alle GAN: nel 2021, i ricercatori dell'azienda OpenAI hanno proposto i modelli di diffusione come nuova e migliore tecnica per la generazione di immagini nel loro articolo «Diffusion Models Beat GANS on Image Synthesis».
La differenza rilevante nel processo risiede nelle fasi iterative dei modelli di diffusione, che consentono di evitare duplicati e ottenere un maggiore livello di dettaglio. La tecnica di diffusione si è oggi affermata in tutti i comuni strumenti di generazione di immagini.
Come per l'AI testuale, anche nel campo dei generatori di immagini AI esistono sempre più modelli. Attualmente, i modelli di punta in termini di qualità sono GPT-4o e Midjourney.
Das «o» in GPT-4o steht für «omni» und beschreibt das Modell von OpenAI als multimodal. Es kann also nativ (das heisst von sich aus) Text, Bild und Audio verarbeiten. GPT-4o kann Bilder generieren, diese aber auch analysieren oder darüber sprechen. Das ist besonders dienlich bei Aufgaben, die beides erfordern (wie etwa beim Erstellen einer Präsentation). GPT-4o läuft seit März 2025 als Standard-Bildgenerator in ChatGPT. Davor wurde für die Bildgenerierung seit 2023 das Diffusionsmodell DALL·E (ebenfalls von OpenAI) eingesetzt.
Ab 13 Jahren empfohlen
Web, mobile App, API für Entwickler*innen
Prova GPT-4o: https://chat.openai.com/ (apre una nuova finestra)
Midjourney è un'intelligenza artificiale generativa specializzata esclusivamente nella generazione di immagini, e lo fa davvero bene: l'IA è nota per le sue immagini di alta qualità e spesso surreali. I parametri disponibili offrono molte possibilità di influenzare e sviluppare ulteriormente l'immagine durante la creazione. Anche il fattore community gioca un ruolo importante in Midjourney.
A partire dai 13 anni
tramite Discord o Midjourney Alpha
Prova Midjourney (è necessario un account Discord o Google): https://midjourney.com/home(apre una nuova finestra)
Per utenti avanzati: Midjourney Parameter(apre una nuova finestra)
Canva è una piattaforma di design molto apprezzata che, grazie all'integrazione con Magic Media, offre anche una funzione di generazione intelligente delle immagini. L'attenzione è rivolta alla semplicità d'uso e alla possibilità di integrare i contenuti direttamente nei progetti realizzati (volantini, storie sui social media, candidature ecc.).
Consigliato dai 13 anni in su
Web, app mobile
Prova Canva AI: https://www.canva.com/ (apre una nuova finestra)
Adobe Firefly è il generatore di immagini basato sull'intelligenza artificiale di Adobe e integrato nei programmi della Adobe Creative Suite. Questa IA per immagini si basa su valori etici: secondo le informazioni fornite(apre una nuova finestra) dal fornitore, il primo modello commerciale di Firefly è stato addestrato con immagini Adobe Stock e con opere e contenuti con licenza libera (o con copyright scaduto).
A partire dai 13 anni (licenza Adobe)
Adobe Creative Cloud, Web
Prova Adobe Firefly: https://firefly.adobe.com/ (apre una nuova finestra)
Stable Diffusion è stato pubblicato nell'agosto 2022 come modello di generazione di immagini open source. Di conseguenza, oggi l'IA è spesso integrata in programmi di terze parti come civitai.com o leonardo.ai. Stable Diffusion offre il massimo controllo e personalizzazione, ma richiede conoscenze tecniche ed è quindi utilizzato principalmente dai professionisti del design.
A seconda della piattaforma utilizzata
App, web, installazioni locali
Prova Stable Diffusion Online: stablediffusionweb.com(apre una nuova finestra)
Qual è la differenza in termini di qualità tra i generatori di immagini più noti quando eseguono lo stesso prompt?
«Stile fumettistico accattivante, grandangolo, elefante di peluche che stringe la mano a un topo, tramonto, colori caldi – formato 16:9»
La prossima generazione di generatori di immagini basati sull'intelligenza artificiale funziona in modo leggermente diverso rispetto ai modelli precedenti: invece di comprendere solo il testo, i modelli multimodali «Omni» come GPT-4o sono in grado di elaborare allo stesso modo testo, immagini e audio. Sembra multitasking, ed effettivamente lo è. Ma solo per l'intelligenza artificiale: per te l'utilizzo sarà più semplice e naturale.
L'IA multimodale va oltre il testo e le immagini (video in tedesco).
Cosa significa questo per i tuoi prompt:
Scrivi un prompt di testo (ad esempio «Una mela rossa su un tavolo») e lasci che l'IA generi un'immagine.
Puoi anche caricare un'immagine di una mela rossa su un tavolo e chiedere all'IA: «Rendi blu la mela e aggiungi una banana» o «Crea una scena simile, ma in inverno».
Con i modelli multimodali è diventato più facile perfezionare l'immagine desiderata con un esempio e dialogando con l'IA. A differenza dei generatori di immagini puri come DALL·E, i modelli multimodali come GPT-4o sono in grado di ricordare la cronologia della chat e le versioni precedenti dell'immagine, elaborando così l'immagine in modo iterativo e collaborativo con te. Immagina l'IA per le immagini come un designer personale che ti guarda mentre lavori e con cui puoi scambiare opinioni. Utilizza la funzione di dialogo se hai domande sull'elaborazione delle immagini per visualizzare alternative o fornire un feedback concreto sui risultati (mi piace questo, ma quello no).
Un piccolo inconveniente: i modelli multimodali sono ancora agli inizi e talvolta non sono ancora del tutto maturi. Può quindi accadere che l'IA dimentichi parti dell'immagine originale o che non tutti i dettagli dell'immagine possano essere controllati durante la conversazione.
Un buon prompt fornisce indicazioni sullo stile visivo, sui contenuti concreti e sulle proporzioni (a seconda del modello). Qui ti sveliamo altri aspetti a cui prestare attenzione affinché l'IA generi le immagini che desideri.
Alcuni principi di base: quando crei un prompt, fai attenzione a non usare parole di riempimento. La lunghezza corretta del prompt è fondamentale, perché i prompt più lunghi aiutano l'IA a realizzare la tua idea. Tuttavia, se le indicazioni sono troppo dettagliate, l'IA potrebbe perdersi e visualizzare elementi che forse non sono così importanti per te.
Cerca anche termini tecnici dell'arte visiva(apre una nuova finestra), in modo da poter fornire all'IA indicazioni stilistiche molto precise.
Ogni IA generativa funziona in modo leggermente diverso. Tuttavia, vale la pena prestare attenzione a questi aspetti fondamentali:
Non tutti i generatori di immagini comprendono il tedesco. Informati su quale lingua utilizza il generatore di immagini desiderato e inserisci i comandi in quella lingua. (Puoi anche avvalerti dell'aiuto di un traduttore automatico come DeepL(apre una nuova finestra).)
In che stile deve essere realizzata l'immagine? Desideri uno stile artistico stilizzato (come i quadri di Van Gogh) o un motivo fotorealistico? Dai all'IA un incarico preciso che possa eseguire.
Cosa si vede esattamente nell'immagine? Cosa c'è in primo piano e cosa sullo sfondo? Indica tutti gli elementi necessari.
In quale combinazione di colori deve essere generata l'immagine? Desideri un'immagine in bianco e nero o una rappresentazione a colori? Da dove proviene la luce nell'immagine? Qual è l'atmosfera che si respira nell'immagine?
Alcuni strumenti (come Midjourney) consentono di determinare autonomamente le proporzioni, ad esempio ritratti con proporzioni 3:4.
La generazione di immagini tramite IA può fare molto di più che «solo» promuovere l'espressione artistica personale. Può anche aiutarti nella vita familiare quotidiana o a scuola. Dall'arredamento della camera alla lezione di storia: le possibilità sono più varie di quanto potresti immaginare.
Crea un biglietto di Natale con l'IA (video in tedesco).
Hai bisogno di una nuova favola della buonanotte per tuo figlio? Con modelli multimodali puoi creare facilmente il tuo libro illustrato. L'intelligenza artificiale ti aiuta a scambiare idee e a formulare la tua storia proprio come desideri. Può trasformare i tuoi schizzi veloci in disegni di alta qualità per illustrare il tuo libro. E può darti consigli utili sulla stampa e l'organizzazione.
Desideri dare una ventata di freschezza al tuo salotto, magari con un nuovo divano? O magari una parete di un altro colore? Se non riesci a immaginartelo o non vuoi farlo, lascia che ci pensi l'IA al posto tuo. Basta fotografare il tuo salotto e provare con l'IA diversi mobili, colori o stili di arredamento prima di spendere soldi.
«Mostrami il soggiorno nella foto che ho caricato con un divano azzurro cielo e pareti bianchissime.»
Che sia per un compleanno, per Natale o per un matrimonio, con l'IA puoi creare biglietti personalizzati invece di regalare biglietti standard acquistati in negozio.
Nota: ricordati di proteggere i dati personali e valuta attentamente se e quali foto di te o di altre persone (preferibilmente dopo aver ottenuto il loro consenso) caricare nell'IA.
Creare un biglietto di Natale (video sopra)
Come spieghi ai tuoi studenti com'era realmente la vita nel Medioevo? I libri di testo a volte possono essere aridi e non sempre sono disponibili immagini illustrative. Lascia che l'IA ricostruisca scene storiche e discutine con i tuoi studenti in classe:
«Com'era questa città allora rispetto ad oggi?»
I processi microbiologici avvengono su scala microscopica e non sono solitamente visibili ad occhio nudo. Un'intelligenza artificiale è però in grado di ingrandire una cellula vegetale fino a renderla visibile e di rendere visibili cose invisibili. Al contrario, può anche rendere tangibile qualcosa di incredibilmente grande, come l'evoluzione dell'uomo in un filmato accelerato.
«Mostrami come è fatta una cellula vegetale dall'interno.»
Soprattutto per chi apprende in modo visivo, le immagini didattiche possono essere un vantaggio nell'apprendimento delle lingue rispetto alle semplici schede con parole. L'IA accompagna i vocaboli con immagini e crea scene appropriate o mnemonici che facilitano la memorizzazione.
«A happy dog plays in the park.» / «Une famille française au petit-déjeuner.»
Naturalmente, l'IA può anche aiutare a trasmettere competenze mediatiche, ad esempio generando immagini IA e chiedendo ai bambini di ordinarle insieme alle immagini fotografate.
«Come si distinguono le foto reali dalle immagini generate dall'IA?» / «Quali sono gli errori tipici dell'IA?» / «Come si contrassegnano correttamente i contenuti generati dall'IA?» / «Cosa significa questo per il giornalismo e la diffusione delle notizie?»
I concetti astratti sono spesso difficili da immaginare. In questo caso, l'IA può essere d'aiuto e abbozzare rapidamente delle idee (senza dover investire molto denaro). Può anche fornire supporto nella creazione di moodboard, integrandoli con immagini generate dall'IA. A volte l'IA aiuta a superare i blocchi creativi riempiendo il foglio bianco con una prima idea. In questo modo si guadagna più tempo per l'elaborazione finale dell'idea migliore.
«Crea un moodboard per il design di una confezione di caffè biologico in stile scandinavo.»
Generare continuamente nuovi contenuti per l'azienda è un lavoro impegnativo. Lasciati aiutare dall'IA. Un modello multimodale ti supporta sia nella fase di ideazione che nella realizzazione delle prime visualizzazioni. Alcune aziende del settore della moda puntano già interamente su contenuti generati dall'IA per le loro campagne su larga scala.
«Crea una seconda variante dell'immagine per eseguire un test A/B. Per la seconda variante, utilizza colori più vivaci e prospettive dinamiche.»
Le noiose diapositive PowerPoint con clipart standard non convincono più nessuno. Ma la grafica professionale a volte è semplicemente troppo costosa. L'IA ti offre il giusto compromesso e crea grafici e diagrammi secondo i tuoi gusti.
«Genera un'icona in nero che simboleggi il lavoro di squadra.» / «Visualizza il nostro processo di trasformazione includendo e collegando tra loro i seguenti aspetti: ...»
Se desideri utilizzare contenuti generati dall'IA per scopi commerciali, informati preventivamente sui diritti d'uso e sulle condizioni di protezione dei dati dei modelli. Per motivi etici e legali, contrassegna in modo trasparente i contenuti generati dall'IA come tali. Naturalmente, rispetta anche le eventuali linee guida di corporate design. Considera l'IA come un complemento, ma non come un sostituto delle capacità e della creatività umane.
Saper riconoscere le immagini generate dall'IA sta diventando una competenza mediatica importante. Qui ti mostriamo a cosa prestare attenzione e cosa fare se non sei sicuro. Con un po' di pratica svilupperai un buon intuito. Tuttavia, resta sempre vigile, perché le tecnologie migliorano ogni giorno.
Ciò che vale per il riconoscimento dei deepfake video aiuta solitamente anche a smascherare le immagini generate dall'IA. Ma non è affatto facile. Anche gli esperti a volte sbagliano. Quindi, se non sei sicuro, è del tutto normale. L'importante è rimanere critici e indagare in caso di incertezza.
Sì, alcune IA per immagini hanno ancora difficoltà a riprodurre correttamente mani e dita. Presta particolare attenzione ai gioielli: gli anelli spesso si fondono in modo innaturale con le mani.
Guarda i dettagli: come sono disposti i denti? Sono troppo perfetti o allineati in modo innaturale? Com'è la pelle: presenta strane transizioni? E le pupille? Gli occhi sembrano vivi o spenti? Gli occhi nelle immagini generate hanno spesso uno sguardo fisso.
Anche se la situazione sta migliorando sempre di più, alcune IA di immagini hanno ancora difficoltà a visualizzare il testo in modo corretto e leggibile. Di conseguenza, le parole a volte non hanno senso o i cartelli contengono lingue immaginarie.
Presta attenzione anche ai riflessi sulle finestre o sulle superfici: sono realistici? Da dove proviene la fonte di luce e ce n'è davvero una? Le ombre corrispondono alla direzione della fonte di luce?
Cerca l'immagine in questione nella ricerca (inversa) di Google per scoprire dove altro potrebbe essere stata utilizzata. Questo può aiutarti a risalire alla provenienza dell'immagine.
A livello mondiale, anche aziende leader nel settore tecnologico come Adobe, Intel o Microsoft si stanno impegnando sempre più affinché l'origine dei contenuti multimediali possa essere certificata con filigrane. Forse la tua immagine è certificata?
In linea di massima vale la regola: non fidarti di una sola caratteristica, ma verifica piuttosto diversi aspetti. Mantieni un atteggiamento scettico soprattutto nei confronti delle immagini perfette.
Oltre ai video, i deepfake esistono naturalmente anche sotto forma di immagini. Ad esempio, quando gli elementi dell'immagine vengono sostituiti mediante IA generativa in modo tale che il messaggio cambia, ma l'immagine continua a sembrare autentica. Nel caso delle immagini, anche il diritto d'autore è un argomento molto controverso.
Come insegnante ti trovi di fronte alla domanda: devo utilizzare l'IA per immagini nella preparazione delle lezioni o durante le lezioni stesse? E se sì, come? Come spesso accade, anche in questo caso vale la regola: sfrutta le opportunità offerte dalle nuove tecnologie, ma sii consapevole dei limiti e dei rischi. In questo modo potrai prendere le tue decisioni e contribuire consapevolmente a sviluppare la competenza mediatica nella tua classe.
Come spieghi a un bambino della scuola primaria come funziona un pannello solare? O come una pianta fa la fotosintesi? I modelli multimodali sono particolarmente efficaci nel rappresentare visivamente il funzionamento e le relazioni complesse e nel spiegarli in modo adeguato a una determinata fascia d'età. Mentre GPT-4o può utilizzare la metafora illustrativa di una fabbrica per spiegare il funzionamento di un pannello solare, il generatore di immagini integrato completa la spiegazione con un'illustrazione appropriata.
Con questo supporto, durante la preparazione della lezione avrai rapidamente a disposizione immagini appropriate senza dover pagare costose licenze (o stressarti).
Un'immagine vale più di mille parole, soprattutto quando le parole non fanno ancora parte del proprio vocabolario. È il caso, ad esempio, delle lezioni con bambini che non parlano correntemente il tedesco. Oppure quando i concetti fondamentali relativi al materiale didattico sono molto astratti. In questi casi, immagini, grafici e sequenze visive possono aiutare a rendere l'argomento facilmente comprensibile a tutti.
Se generi rappresentazioni storiche o scientifiche con l'aiuto dell'IA per immagini e le integri nella lezione, da un lato dichiara apertamente che hai utilizzato l'IA. Dall'altro lato, fai notare che non si tratta di rappresentazioni storicamente o scientificamente corrette, ma piuttosto di approcci visivi al tema, che non sono necessariamente reali. È possibile discutere direttamente in classe perché e in che modo le immagini generate differiscono dal materiale storico reale.
Tieni inoltre presente che le rappresentazioni generate dall'IA possono rafforzare gli stereotipi (poiché un'IA generativa riproduce sempre modelli diffusi e appresi) quando, ad esempio, si rappresentano gruppi culturali.
Naturalmente, l'intelligenza artificiale applicata alle immagini può essere molto utile quando si tratta di illustrare visivamente concetti complessi. Tuttavia, in questo modo l'IA sostituisce in parte la capacità di ragionamento degli studenti, in particolare quella creativa.
È come guardare un film prima di aver letto il libro: se poi decidi comunque di leggere il libro, nella tua mente avrai automaticamente le immagini dei personaggi del film, invece di crearne di tue. Sii quindi consapevole del potere delle immagini e del fatto che esse influenzano l'immaginazione degli studenti.
Nel corso gli insegnanti imparano a conoscere i generatori di immagini basati sull'intelligenza artificiale e scoprono cosa succede dietro le quinte non appena vengono inviati i prompt. Discuteremo dove e come i generatori di immagini sono adatti all'insegnamento e come la realtà, la manipolazione e la responsabilità relative alla generazione di immagini possono essere affrontate in classe. Il webinar di 90 minuti è stato realizzato in collaborazione con LerNetz.
Qui abbiamo raccolto ulteriori informazioni e contenuti sul tema "AI e generatori di immagini".
Marcel è un formatore di Swisscom. È a vostra completa disposizione per tutte le domande sull'IA.
Formatore di Swisscom