ⓘ Questa pagina è stata tradotta con l'aiuto dell'intelligenza artificiale.
Un'immagine fotorealistica di una mucca che surfa in mare esultante: per molto tempo è stata una cosa impossibile. Oggi soggetti del genere fanno parte della quotidianità. E da tempo non si tratta più solo di generare immagini: l'ultima generazione di IA per immagini può essere gestita tramite dialogo. Basta caricare un'immagine e descrivere cosa si desidera modificare e l'IA lo realizza con precisione. In questa pagina spieghiamo come funzionano le IA per immagini, presentiamo i modelli più noti, mostriamo casi d'uso utili per la vita quotidiana, la scuola e il lavoro e ti sveliamo come riconoscere le immagini generate dall'IA.
Direttamente al tema
Condividi la pagina
Per generare immagini, oggi un'IA ha a disposizione essenzialmente due metodi diversi: i modelli di diffusione e i modelli autoregressivi. Entrambi sono in grado di produrre immagini impressionanti, ma adottano approcci fondamentalmente diversi:
I modelli di diffusione partono da un rumore casuale (una superficie grigia e sgranata) e lo perfezionano in tanti piccoli passaggi fino a ottenere l'immagine che hai descritto nel prompt. Questo approccio iterativo consente un alto livello di dettaglio e una grande varietà stilistica. Esempi noti di modelli di diffusione sono Midjourney o Stable Diffusion. Tali modelli sono particolarmente efficaci quando si tratta di risultati artistici e stilistici. Tuttavia, hanno qualche difficoltà a tradurre con precisione descrizioni testuali complesse o a modificare immagini esistenti.
La nuova generazione di IA per immagini segue un approccio diverso: i modelli autoregressivi fanno parte di modelli linguistici multimodali più ampi. (Si tratta di modelli in grado di comprendere ed elaborare contemporaneamente testo, immagini e, in parte, anche audio.) Comprendono quindi i prompt in modo nettamente migliore e possono rispondere alle richieste di immagini tenendo maggiormente conto del contesto. Soprattutto nell’elaborazione delle immagini si nota una grande differenza qualitativa rispetto ai modelli di diffusione: l’IA modifica solo ciò che richiedi nel prompt in linguaggio naturale. Esempi noti di modelli autoregressivi sono GPT Image (OpenAI) e Nano Banana Pro (Google).
Fino al 2021 circa, le Generative Adversarial Networks (GAN) erano la tecnologia leader. Queste sono state nel frattempo chiaramente superate dai modelli di diffusione e autoregressivi in termini di qualità e varietà e oggi non hanno più alcun ruolo negli strumenti comuni.
Quando le immagini vengono create con l'aiuto dell'IA, la situazione giuridica è interessante: attualmente in Svizzera non sono protette dal diritto d'autore, il che ne rende flessibile l'utilizzo. Tuttavia, è necessario tenere conto dei diritti di marchio e della personalità. I rapidi sviluppi tecnologici potrebbero portare a modifiche del diritto d'autore in futuro. Rimani informato per essere sempre aggiornato.
Come per l'AI testuale, anche nel campo dei generatori di immagini AI esistono sempre più modelli. Attualmente, i modelli di punta in termini di qualità sono GPT-4o e Midjourney.
GPT Image è il modello di generazione e modifica delle immagini di OpenAI. Successore di DALL·E, GPT Image sostituisce anche GPT-4o. Il modello è particolarmente efficace nell’interpretare i prompt, poiché testo e immagine vengono generati nella stessa rete neurale. Ciò consente di modificare in modo mirato determinati elementi o aree di un’immagine.
Consigliato a partire dai 13 anni
Web, app, API per sviluppatori, Microsoft Copilot
Prova GPT Image: https://chat.openai.com/ (apre una nuova finestra)
Midjourney è considerato il «gold standard» nella generazione di immagini tramite IA ed è noto per la profondità stilistica e la qualità artistica. Ciò distingue questo modello di immagini specializzato dai modelli generici come GPT Image. La versione 7 (2025) introduce una calibrazione dello stile personale, l'input vocale e, per la prima volta, la generazione di video. Le immagini esistenti possono essere animate in clip della durata massima di 21 secondi.
Consigliato a partire dai 13 anni
Web, Discord
Prova Midjourney: https://midjourney.com/home(apre una nuova finestra)
Per utenti avanzati: Midjourney Parameter(apre una nuova finestra)
Canva è una piattaforma di design molto apprezzata che, con Dream Lab, offre una potente funzione di generazione di immagini basata sull'intelligenza artificiale. L'attenzione è rivolta alla semplicità d'uso e all'integrazione diretta nei progetti esistenti. Dal 2025 è inoltre integrato Nano Banana Pro di Google, che migliora notevolmente l'elaborazione delle immagini e la visualizzazione del testo.
Consigliato a partire dai 13 anni
Web, app
Prova Canva AI: https://www.canva.com/ (apre una nuova finestra)
Adobe Firefly si è evoluto da generatore di immagini basato sull'intelligenza artificiale a uno studio creativo autonomo basato sull'intelligenza artificiale. Questo strumento riunisce la generazione e l'editing di immagini, video e audio su un'unica piattaforma. L'approccio etico rimane una caratteristica fondamentale, poiché tutti i modelli proprietari di Firefly sono stati addestrati esclusivamente con contenuti concessi in licenza, immagini di Adobe Stock e opere di pubblico dominio e sono quindi utilizzabili senza rischi dal punto di vista commerciale.
A partire dai 13 anni
Adobe Creative Cloud, Web, App
Prova Firefly: https://firefly.adobe.com/ (apre una nuova finestra)
Chi desidera un maggiore controllo sulla generazione delle immagini troverà ciò che cerca nel mondo open source. A differenza delle IA per immagini commerciali, questi modelli funzionano localmente sul proprio computer, senza abbonamenti e senza cloud. In cambio offrono la massima personalizzazione. Ideali per sviluppatori, creativi e organizzazioni attente alla protezione dei dati. Per iniziare, però, servono competenze tecniche e un hardware potente.
Ecco la nostra selezione di modelli open source a confronto:
https://huggingface.co/black-forest-labs/FLUX.1-schnell(apre una nuova finestra)
Licenza: Apache 2.0
Caratteristiche: veloce, di alta qualità e utilizzabile liberamente anche a fini commerciali
https://huggingface.co/stabilityai/stable-diffusion-3.5-large(apre una nuova finestra)
Licenza: licenza comunitaria
Caratteristiche: grande comunità, ampia varietà di stili disponibili
Licenza: Open Weights (Tencent Hunyuan Community License)
Caratteristiche: modello autoregressivo, eccellente ad alta risoluzione, utilizzabile anche su hardware meno potente
I modelli open source sono installazioni locali disponibili tramite piattaforme web come Hugging Face(apre una nuova finestra).
Nano Banana Pro (nome ufficiale: Gemini 3 Pro Image) è il modello di generazione di immagini più avanzato di Google. È stato lanciato nel novembre 2025 ed è integrato direttamente nella gamma di prodotti Google. Il modello si distingue per la qualità fotorealistica e la resa accurata dei testi in diverse lingue.
A partire dai 13 anni (a partire dai 18 anni nell'UE e nel Regno Unito)
App Gemini, Google Workspace, NotebookLM, Ricerca Google, API
Prova Nano Banana Pro: https://gemini.google.com/(apre una nuova finestra)
Qual è la differenza in termini di qualità tra i generatori di immagini più noti quando eseguono lo stesso prompt?
«Stile fumettistico accattivante, grandangolo, elefante di peluche che stringe la mano a un topo, tramonto, colori caldi – formato 16:9»
La nuova generazione di generatori di immagini basati sull'intelligenza artificiale funziona in modo diverso rispetto ai modelli precedenti: invece di limitarsi a ricevere un prompt testuale, i modelli multimodali come GPT Image o Nano Banana Pro sono in grado di comprendere ed elaborare contemporaneamente testo, immagini e, in alcuni casi, anche audio. L'utilizzo risulta così ancora più naturale e intuitivo.
L'IA multimodale va oltre il testo e le immagini (video in tedesco).
Cosa significa questo per i tuoi prompt:
Scrivi un prompt di testo (ad esempio «Una mela rossa su un tavolo») e lasci che l'IA generi un'immagine.
Puoi anche caricare un'immagine di una mela rossa su un tavolo e chiedere all'IA: «Rendi blu la mela e aggiungi una banana» o «Crea una scena simile, ma in inverno».
Con i modelli multimodali lavori in dialogo con l'IA. È come avere una designer personale, alla quale guardi da dietro le spalle e alla quale dai un feedback in tempo reale. L'IA ricorda la cronologia della vostra chat e le versioni precedenti dell'immagine e può sviluppare l'immagine in modo iterativo insieme a te. È così possibile modificare singoli elementi come l’illuminazione, lo sfondo, i colori o le espressioni facciali, mentre il resto dell’immagine rimane invariato. Utilizza questa funzione di dialogo per esplorare alternative, fornire un feedback concreto («Questo mi piace, quello invece no») o avvicinarti passo dopo passo all’immagine dei tuoi sogni.
Un piccolo inconveniente: i modelli multimodali sono ancora agli inizi e talvolta non sono ancora del tutto maturi. Può quindi accadere che l'IA dimentichi parti dell'immagine originale o che non tutti i dettagli dell'immagine possano essere controllati durante la conversazione.
Poiché i modelli multimodali sono in grado di analizzare e descrivere le immagini, vengono utilizzati anche per la creazione di testi alternativi. In questo modo generano testi alternativi destinati alle persone ipovedenti, che possono essere inseriti nelle immagini digitali per garantire una migliore accessibilità.
Un buon prompt fornisce indicazioni sullo stile visivo, sui contenuti concreti e sulle proporzioni (a seconda del modello). Qui ti sveliamo altri aspetti a cui prestare attenzione affinché l'IA generi le immagini che desideri.
Alcuni principi di base: quando crei un prompt, fai attenzione a non usare parole di riempimento. La lunghezza corretta del prompt è fondamentale, perché i prompt più lunghi aiutano l'IA a realizzare la tua idea. Tuttavia, se le indicazioni sono troppo dettagliate, l'IA potrebbe perdersi e visualizzare elementi che forse non sono così importanti per te.
Cerca anche termini tecnici dell'arte visiva(apre una nuova finestra), in modo da poter fornire all'IA indicazioni stilistiche molto precise.
Ogni IA generativa funziona in modo leggermente diverso. Tuttavia, vale la pena prestare attenzione a questi aspetti fondamentali:
Non tutti i generatori di immagini comprendono il tedesco. Informati su quale lingua utilizza il generatore di immagini desiderato e inserisci i comandi in quella lingua. (Puoi anche avvalerti dell'aiuto di un traduttore automatico come DeepL(apre una nuova finestra).)
In che stile deve essere realizzata l'immagine? Desideri uno stile artistico stilizzato (come i quadri di Van Gogh) o un motivo fotorealistico? Dai all'IA un incarico preciso che possa eseguire.
Cosa si vede esattamente nell'immagine? Cosa c'è in primo piano e cosa sullo sfondo? Indica tutti gli elementi necessari.
In quale combinazione di colori deve essere generata l'immagine? Desideri un'immagine in bianco e nero o una rappresentazione a colori? Da dove proviene la luce nell'immagine? Qual è l'atmosfera che si respira nell'immagine?
Alcuni strumenti (come Midjourney) consentono di determinare autonomamente le proporzioni, ad esempio ritratti con proporzioni 3:4.
Invece di descrivere a parole uno stile o un'atmosfera, puoi semplicemente mostrare un'immagine all'IA. Carica una foto di riferimento e chiedi all'IA di tradurre il tuo prompt in quello stile. Oppure di sviluppare e modificare direttamente l'immagine di riferimento.
La generazione di immagini tramite IA non si limita a favorire l'espressione artistica personale. Può esserti concretamente d'aiuto nella vita quotidiana in famiglia, così come in ambito scolastico e lavorativo. Le possibilità sono più varie di quanto potresti pensare.
Crea un biglietto di Natale con l'IA (video in tedesco).
Hai bisogno di una nuova favola della buonanotte per tuo figlio? Con modelli multimodali puoi creare facilmente il tuo libro illustrato. L'intelligenza artificiale ti aiuta a scambiare idee e a formulare la tua storia proprio come desideri. Può trasformare i tuoi schizzi veloci in disegni di alta qualità per illustrare il tuo libro. E può darti consigli utili sulla stampa e l'organizzazione.
Desideri dare una ventata di freschezza al tuo salotto, magari con un nuovo divano? O magari una parete di un altro colore? Se non riesci a immaginartelo o non vuoi farlo, lascia che ci pensi l'IA al posto tuo. Basta fotografare il tuo salotto e provare con l'IA diversi mobili, colori o stili di arredamento prima di spendere soldi.
«Mostrami il soggiorno nella foto che ho caricato con un divano azzurro cielo e pareti bianchissime.»
Che sia per un compleanno, per Natale o per un matrimonio, con l'IA puoi creare biglietti personalizzati invece di regalare biglietti standard acquistati in negozio.
Nota: ricordati di proteggere i dati personali e valuta attentamente se e quali foto di te o di altre persone (preferibilmente dopo aver ottenuto il loro consenso) caricare nell'IA.
Creare un biglietto di Natale (video sopra)
Grazie ai modelli autoregressivi, l'elaborazione delle immagini con l'aiuto dell'IA diventa ancora più semplice. Basta caricare un'immagine (attenzione: protezione dei dati) e chiedere all'IA, ad esempio, di rimuovere o sostituire lo sfondo oppure di eliminare una determinata persona dalla foto. È anche possibile modificare la qualità delle foto e far sembrare come nuove le immagini ingiallite.
«Restaura la mia vecchia foto di famiglia.»
Come spieghi ai tuoi studenti com'era realmente la vita nel Medioevo? I libri di testo a volte possono essere aridi e non sempre sono disponibili immagini illustrative. Lascia che l'IA ricostruisca scene storiche e discutine con i tuoi studenti in classe:
«Com'era questa città allora rispetto ad oggi?»
I processi microbiologici avvengono su scala microscopica e non sono solitamente visibili ad occhio nudo. Un'intelligenza artificiale è però in grado di ingrandire una cellula vegetale fino a renderla visibile e di rendere visibili cose invisibili. Al contrario, può anche rendere tangibile qualcosa di incredibilmente grande, come l'evoluzione dell'uomo in un filmato accelerato.
«Trasforma il mio schizzo di una cellula che ho caricato in un'illustrazione realistica.»
Soprattutto per chi apprende in modo visivo, le immagini didattiche possono essere un vantaggio nell'apprendimento delle lingue rispetto alle semplici schede con parole. L'IA accompagna i vocaboli con immagini e crea scene appropriate o mnemonici che facilitano la memorizzazione.
«A happy dog plays in the park.» / «Une famille française au petit-déjeuner.»
Naturalmente, l'IA può anche aiutare a trasmettere competenze mediatiche, ad esempio generando immagini IA e chiedendo ai bambini di ordinarle insieme alle immagini fotografate.
«Come si distinguono le foto reali dalle immagini generate dall'IA?» / «Quali sono gli errori tipici dell'IA?» / «Come si contrassegnano correttamente i contenuti generati dall'IA?» / «Cosa significa questo per il giornalismo e la diffusione delle notizie?»
I concetti astratti sono difficili da immaginare. In questi casi, l’intelligenza artificiale può venire in aiuto e abbozzare rapidamente delle idee. Può anche essere d’aiuto nella creazione di moodboard, sia illustrandole che costruendole direttamente. A volte l'IA aiuta a superare i blocchi creativi riempiendo il foglio bianco con una prima idea. In questo modo si guadagna più tempo per l'elaborazione finale dell'idea migliore.
«Crea un moodboard per il design di una confezione di caffè biologico in stile scandinavo.»
Generare continuamente nuovi contenuti per l'azienda è un lavoro impegnativo. Lasciati aiutare dall'IA. Un modello multimodale ti supporta sia nella fase di ideazione che nella realizzazione delle prime visualizzazioni. Alcune aziende del settore della moda puntano già interamente su contenuti generati dall'IA per le loro campagne su larga scala.
«Crea una seconda variante dell'immagine per eseguire un test A/B. Per la seconda variante, utilizza colori più vivaci e prospettive dinamiche.»
Vuoi rendere più chiari i tuoi dati complessi? Modelli di immagini come Nano Banana Pro di Google generano infografiche complete a partire da un set di dati o da una descrizione. Microsoft Copilot accede direttamente ai tuoi archivi di file (con le autorizzazioni appropriate) e raccoglie autonomamente le informazioni necessarie.
«Visualizza il nostro processo di trasformazione analizzando i due documenti archiviati [qui] e mettendoli in relazione tra loro.»
Se sei una PMI o un libero professionista con poche risorse a disposizione, l'IA può aiutarti in modo eccellente anche nella creazione di foto dei prodotti: scatta le foto dei tuoi prodotti su uno sfondo bianco e lascia che l'IA le trasformi in immagini lifestyle dall'aspetto professionale in diversi contesti.
«Crea per me foto dei prodotti per il negozio online da 4 diverse prospettive.»
Se desideri utilizzare contenuti generati dall'IA per scopi commerciali, informati preventivamente sui diritti d'uso e sulle condizioni di protezione dei dati dei modelli. Per motivi etici e legali, contrassegna in modo trasparente i contenuti generati dall'IA come tali. Naturalmente, rispetta anche le eventuali linee guida di corporate design. Considera l'IA come un complemento, ma non come un sostituto delle capacità e della creatività umane.
Saper riconoscere le immagini generate dall'IA sta diventando una competenza mediatica importante. Qui ti mostriamo a cosa prestare attenzione e cosa fare se non sei sicuro. Con un po' di pratica svilupperai un buon intuito. Tuttavia, resta sempre vigile, perché le tecnologie migliorano ogni giorno.
Ciò che vale per il riconoscimento dei deepfake video aiuta solitamente anche a smascherare le immagini generate dall'IA. Ma non è affatto facile. Anche gli esperti a volte sbagliano. Quindi, se non sei sicuro, è del tutto normale. L'importante è rimanere critici e indagare in caso di incertezza.
Mani (numero di dita errato, forme innaturali), denti, orecchie, capelli nei punti di transizione, testi nell'immagine (enigmatici o illeggibili), dettagli dello sfondo (scaffali, cartelli, motivi), errori di simmetria nel viso, sguardo rigido/impersonale, pelle o illuminazione troppo perfette.
Gioielli e accessori che fisicamente non hanno senso. Riflessi sugli occhiali che non si adattano all'ambiente circostante. Ombre o fonti di luce che si contraddicono. Persone che sembrano fluttuare leggermente o posizionate in modo errato nello spazio.
L'origine AI può essere indicata nei metadati dell'immagine. Puoi verificarli qui: contentcredentials.org/verifyAttenzione: i metadati possono andare persi durante il caricamento sui social media o tramite screenshot, quindi controlla sempre il file originale.
SynthID (Google): filigrana invisibile verificabile nell'app Gemini. Tuttavia, SynthID funziona solo per le immagini generate dall'IA di Google. Esistono altri strumenti, ma sono ancora soggetti a errori.
In linea di massima vale la regola: non fidarti di una sola caratteristica, ma verifica piuttosto diversi aspetti. Mantieni un atteggiamento scettico soprattutto nei confronti delle immagini perfette.
Oltre ai video, i deepfake esistono naturalmente anche sotto forma di immagini. Ad esempio, quando gli elementi dell'immagine vengono sostituiti mediante IA generativa in modo tale che il messaggio cambia, ma l'immagine continua a sembrare autentica. Nel caso delle immagini, anche il diritto d'autore è un argomento molto controverso.
Come insegnante ti trovi di fronte alla domanda: devo utilizzare l'IA per immagini nella preparazione delle lezioni o durante le lezioni stesse? E se sì, come? Come spesso accade, anche in questo caso vale la regola: sfrutta le opportunità offerte dalle nuove tecnologie, ma sii consapevole dei limiti e dei rischi. In questo modo potrai prendere le tue decisioni e contribuire consapevolmente a sviluppare la competenza mediatica nella tua classe.
Come spieghi a un bambino della scuola primaria come funziona un pannello solare? O come una pianta fa la fotosintesi? I modelli multimodali sono particolarmente efficaci nel rappresentare visivamente il funzionamento e le relazioni complesse e nel spiegarli in modo adeguato a una determinata fascia d'età. Mentre GPT-4o può utilizzare la metafora illustrativa di una fabbrica per spiegare il funzionamento di un pannello solare, il generatore di immagini integrato completa la spiegazione con un'illustrazione appropriata.
Con questo supporto, durante la preparazione della lezione avrai rapidamente a disposizione immagini appropriate senza dover pagare costose licenze (o stressarti).
Un'immagine vale più di mille parole, soprattutto quando le parole non fanno ancora parte del proprio vocabolario. È il caso, ad esempio, delle lezioni con bambini che non parlano correntemente il tedesco. Oppure quando i concetti fondamentali relativi al materiale didattico sono molto astratti. In questi casi, immagini, grafici e sequenze visive possono aiutare a rendere l'argomento facilmente comprensibile a tutti.
Se generi rappresentazioni storiche o scientifiche con l'aiuto dell'IA per immagini e le integri nella lezione, da un lato dichiara apertamente che hai utilizzato l'IA. Dall'altro lato, fai notare che non si tratta di rappresentazioni storicamente o scientificamente corrette, ma piuttosto di approcci visivi al tema, che non sono necessariamente reali. È possibile discutere direttamente in classe perché e in che modo le immagini generate differiscono dal materiale storico reale.
Tieni inoltre presente che le rappresentazioni generate dall'IA possono rafforzare gli stereotipi (poiché un'IA generativa riproduce sempre modelli diffusi e appresi) quando, ad esempio, si rappresentano gruppi culturali.
Naturalmente, l'intelligenza artificiale applicata alle immagini può essere molto utile quando si tratta di illustrare visivamente concetti complessi. Tuttavia, in questo modo l'IA sostituisce in parte la capacità di ragionamento degli studenti, in particolare quella creativa.
È come guardare un film prima di aver letto il libro: se poi decidi comunque di leggere il libro, nella tua mente avrai automaticamente le immagini dei personaggi del film, invece di crearne di tue. Sii quindi consapevole del potere delle immagini e del fatto che esse influenzano l'immaginazione degli studenti.
Nel corso gli insegnanti imparano a conoscere i generatori di immagini basati sull'intelligenza artificiale e scoprono cosa succede dietro le quinte non appena vengono inviati i prompt. Discuteremo dove e come i generatori di immagini sono adatti all'insegnamento e come la realtà, la manipolazione e la responsabilità relative alla generazione di immagini possono essere affrontate in classe. Il webinar di 90 minuti è stato realizzato in collaborazione con LerNetz.
Qui abbiamo raccolto ulteriori informazioni e contenuti sul tema "AI e generatori di immagini".
Marcel è un formatore di Swisscom. È a vostra completa disposizione per tutte le domande sull'IA.
Formatore di Swisscom