BLOG

26 gennaio 2024

Intelligenza artificiale per immagini: come creare immagini con l’AI

L’intelligenza artificiale oggi è uno strumento (e un argomento) all’ordine del giorno nel mondo della comunicazione digitale: per chi scrive testi, per chi lavora con le immagini, per chi programma siti web.

In questo articolo iniziamo ad esplorare il tema, concentrandoci sull’uso dell’intelligenza artificiale per creare immagini. In particolare parleremo di:

  • principi di base da seguire;
  • come dare istruzioni efficaci ad un generatore di immagini che utilizza l’intelligenza artificiale per ottenere un risultato di qualità;
  • strumenti gratuiti e a pagamento da usare per generare immagini con l’AI.

I lavori grafici che abbiamo scelto di inserire all’interno dell’articolo, come vedremo, sono stati realizzati proprio utilizzando l’intelligenza artificiale.

Ti abbiamo incuriosito? Siamo pronti ad ascoltarti: parlaci del tuo progetto!

Intelligenza artificiale e immagini: i principi di base

L’uso degli strumenti di intelligenza artificiale per il processo di generazione di immagini ha rivoluzionato in modo significativo il settore della grafica digitale, così come è accaduto anche per altri ambiti, come ad esempio il cosiddetto marketing conversazionale.

L’avvento dell’intelligenza artificiale in questo ambito risponde alla necessità di superare alcune limitazioni della produzione grafica tradizionale: soprattutto in termini di tempo, produttività e organizzazione.

Inizialmente, l’idea di affidare la creazione di opere visive complesse a macchine dotate di intelligenza artificiale ha incontrato Più di una resistenza. Con il passare del tempo, però, si è capito che l’intelligenza artificiale non nasce per sostituire i professionisti della grafica, ma per supportarne il lavoro, stimolandone la creatività e permettendo loro di dedicare risorse ed energie alla componente creativa.

Ad esempio, l’AI può gestire al posto dei grafici operazioni ripetitive o di “manovalanza”: questo accade, per citare un caso, quando si tratta di creare layout base o schemi di progettazione fissi. Tale attività richiede tempo: se però è l’intelligenza artificiale ad occuparsene, i designer possono  concentrarsi sui dettagli più raffinati o strategici.

Il funzionamento di base  dell’intelligenza artificiale per generare immagini prevede l’uso di algoritmi avanzati e modelli di apprendimento automatico per analizzare, comprendere e sintetizzare elementi visivi.

 

In sintesi, i meccanismi di base sono i seguenti:

  1. Dataset di addestramento. L’intelligenza artificiale per la generazione di immagini attinge da ampi dataset di immagini preesistenti. Questi dataset, ad esempio, includono una vasta gamma di immagini condivise online, o raccolte da repository pubblici e privati (nel rispetto delle politiche di accesso esistenti).
  2. Riconoscimento di schemi e feature extraction. L’algoritmo analizza le immagini della base di dati a disposizione, identificando schemi, forme e caratteristiche distintive. I modelli di machine learning estraggono informazioni rilevanti, come contorni, colori dominanti e strutture geometriche ricorrenti.
  3. Messa in relazione dei dati e generazione dell’immagine. L’intelligenza artificiale crea connessioni tra i dati estratti, costruendo un modello di comprensione delle relazioni visive. Questo processo consente di capire come diversi elementi visivi interagiscano tra loro all’interno delle immagini partenza. Si tratta di un elemento chiave per la fase di generazione della nuova immagine, che ricombina tra loro le informazioni disponibili.
  4. Meccanismi di autoapprendimento. L’algoritmo utilizza tecniche di apprendimento automatico per migliorare la sua capacità di riconoscere e comprendere schemi complessi. Un’operazione ripetuta dopo l’altra, l’intelligenza artificiale si auto-adatta, ottimizzando i suoi parametri per migliorare la qualità delle immagini prodotte.

 

Il modo in cui l’AI analizza ed estrae i dati esistenti per poi generare nuove immagini dipende in ogni caso dalle istruzioni che l’utente fornisce allo strumento. Si tratta di impartire istruzioni chiare, precise e dettagliate, attraverso i cosiddetti “prompt”: lo vedremo meglio nel secondo paragrafo.

Come creare immagini con intelligenza artificiale

Ma allora, come si interagisce con gli strumenti di intelligenza artificiale per creare immagini efficaci e che rispondano alle esigenze creative e operative di chi la usa? Il punto di partenza è l’articolazione di un prompt efficace.

Quando parliamo di prompt, ci riferiamo all’insieme di istruzioni dettagliate che guida il processo creativo dell’algoritmo alal base dell’AI.

Un prompt ben formulato è fondamentale per ottenere risultati ottimali. Una buona struttura potrebbe richiamare il brief dettagliato che un cliente fornirebbe a un’agenzia di comunicazione o grafica. Ad esempio:

 

  • Obiettivo / Perché ho bisogno di quest’immagine. Specifica l’obiettivo principale per cui verrà utilizzata l’immagine.
  • Target. Definisci il pubblico, indicando chi dovrà essere il destinatario dell’immagine e quali sono le sue caratteristiche.
  • Caratteristiche richieste. Descrivi le specifiche caratteristiche che l’immagine dovrebbe possedere, come colori, composizione, o presenza di elementi particolari.
  • Stile desiderato. Indica lo stile visivo che desideri ottenere: realistico, fotografico, minimalista, vintage, moderno, o qualsiasi altra indicazione di tipo estetico.

 

La chiarezza e la completezza di un prompt sono essenziali per ottenere buoni risultati. Di norma, prompt più lunghi e dettagliati forniscono all’intelligenza artificiale una guida più chiara, portando a risultati più coerenti con le aspettative del creatore e di miglior qualità.

Traducendo in pratica queste linee operative, un esempio di prompt dettagliato da “dare in pasto” all’intelligenza artificiale potrebbe essere il seguente:

 

Voglio un’immagine per promuovere un nuovo smartphone. L’obiettivo è comunicare eccellenza tecnologica. Il target sono giovani professionisti di successo appassionati di tecnologia.

  1. Il prodotto è al centro, con particolare attenzione ai dettagli di design.
  2. Uso di tonalità metalliche.
  3. Ambientazione urbana e moderna.
  4. Immagine che evidenzia le funzioni chiave: multitouch, connettività avanzata, fotocamera hi-tech

Il risultato deve comunicare innovazione e prestigio. Gradito un design minimalista e futuristico.

 

A seconda degli strumenti (alcuni hanno delle limitazioni nel numero di caratteri inseribili nel prompt), si possono anche aggiungere ulteriori dettagli. Noi abbiamo preferito proporre un prompt preciso ma sintetico per dare a chi legge la possibilità di sperimentarlo su più strumenti.

Strumenti avanzati come MidJourney e Firefly (quest’ultimo incluso nella suite Adobe) consentono di affinare ulteriormente gli effetti grafici, permettendo regolazioni precise sull’illuminazione, la correzione dei colori, la definizione dell’esposizione per ottenere effetti fotografici e la sostituzione degli sfondi.

L’immagine generata è pronta per essere utilizzata nella prossima campagna social? Certo che no. Però può aiutare un grafico che cerca idee, o che vuole testare in poco tempo effetti e ispirazioni. Oppure, può fornire uno sfondo o una base grafica su cui lavorare, integrandola con elementi reali.

 

I vantaggi per i professionisti della grafica che decidono di utilizzare l’intelligenza artificiale per generare immagini non si limitano a questo. Ad esempio, l’AI può:

  1. Ridimensionare e adattare immagini. Alcuni generatori di immagini che usano l’intelligenza artificiale possono può essere impiegati per ridimensionare e adattare le immagini, risparmiando tempo.
  2. Ritocco automatico. Gli algoritmi di elaborazione delle immagini possono eseguire automaticamente operazioni di ritocco, regolando la luminosità, il contrasto e la saturazione in base a criteri predefiniti o modelli appresi.
  3. Generazione di layout base. Lo abbiamo già visto: L’IA può creare layout base o schemi di progettazione, risparmiando tempo nella fase iniziale della progettazione grafica e consentendo ai designer di concentrarsi sulla messa a punto  dei dettagli.
  4. Scelta e applicazione colori. Algoritmi specifici applicazione di colori possono applicare automaticamente palette di colori selezionati, risparmiando ai grafici il tempo dedicato a occuparsene manualmente.
  5. Creazione di icone e grafiche standard. Allo stesso modo, per progetti che richiedono icone standard o grafica comune, l’IA può generare elementi grafici utilizzabili con poche rielaborazioni.
  6. Analisi e riorganizzazione di dati visivi. Per progetti basati su un’ampio stock di dati disponibili, l’IA può analizzare e organizzare visivamente i set di dati, facilitando la creazione di infografiche e visualizzazioni complesse.

 

Certo, per ottenere il risultato desiderato, anche a livello base, possono essere necessarie più prove. Tuttavia, uno dei vantaggi dell’AI è la sua capacità di tenere in memoria le conversazioni o i comandi precedenti. Strumenti come Chat GPT nella versione Pro, ad esempio, possono seguire il filo delle richieste dell’utente, migliorando progressivamente il risultato finale attraverso successive interazioni.

Strumenti ed esempi

Vediamo ora alcuni degli strumenti più diffusi per creare immagini con l’intelligenza artificiale.

 

Tra i generatori di immagini più efficaci ci sono ad esempio:

  1. DALL-E. Sviluppato da OpenAI, è un potente modello di generazione di immagini basato sulla tecnologia GPT (Generative Pre-trained Transformer). Ciò significa che il modello è stato addestrato su un vasto dataset di immagini, apprendendo pattern e relazioni visive complesse. DALL-E  può generare immagini completamente nuove a partire da descrizioni testuali dettagliate. Trova impiego in diversi settori, dalla produzione artistica alla creazione di contenuti visivi per la pubblicità e il marketing.
  2. Mid Journey. Mid Journey è uno strumento avanzato per la generazione di immagini che si distingue per l’editing dettagliato delle caratteristiche visive. È sviluppato per offrire un controllo più raffinato su elementi come illuminazione, colore e composizione. L’interfaccia di Mid Journey, infatti, consente agli utenti di regolare con precisione la luce, applicare filtri dettagliati e editare la composizione visiva. Questo strumento è particolarmente apprezzato per la sua capacità di applicare effetti fotografici di alta qualità alle immagini generate. Trova applicazine nei settori in cui è fondamentale ottenere un controllo preciso sugli aspetti visivi, come la produzione di contenuti pubblicitari e l’elaborazione di immagini per siti web.
  3. Stable Diffusion: Stable Diffusion è un’altra innovativa soluzione di generazione di immagini basata su tecniche avanzate di diffusione e modellizzazione. Si tratta però di uno strumento open source che però è più complesso da utilizzare e spesso genera un output di qualità non raffinata. Può però diventare un utile strumento per gli sviluppatori, ad esempio per creare la prima bozza di un sito web.
  4. FireFly della Suite Adobe. FireFly è un componente della suite Adobe dedicato alla generazione di immagini. Si integra con altri strumenti della suite, offrendo funzionalità di editing visuale avanzato. A differenza degli altri strumenti, funziona principalmente con set di istruzioni precise e definite e non con prompt testuali complessi. Ciò dipende dal suo contesto di utilizzo, all’interno di una suite pensata per essere utilizzata da grafici e designer. FireFly si distingue per la sua versatilità, consentendo la regolazione di parametri dettagliati come l’illuminazione, la tonalità dei colori e la definizione dell’esposizione. La sua interfaccia user-friendly facilita il processo creativo: per questo è ampiamente utilizzato dagli artisti grafici e dai professionisti del settore e si presta a diverse applicazioni, dal ritocco fotografico all’elaborazione di immagini per progetti di design grafico.

 

Questi strumenti rappresentano solo una piccola parte delle risorse disponibili. Un ottimo metodo è quello di metterli in competizione tra loro, confrontando i risultati generati da ciascuno di essi con lo stesso prompt di base.

Ecco alcuni esempi concreti di risultati creati con lo stesso prompt di base da generatori di immagini differenti. Iniziamo con il nostro prompt per generare una immagine che promuova uno smartphone di ultima generazione: il testo è stato sintetizzato per rispettare il limite nel numero di caratteri, imposto dalla versione base di Dall-e.

 

“Voglio un’immagine che promuova un nuovo smartphone. L’obiettivo è comunicare eccellenza tecnologica. Il target sono giovani professionisti di successo appassionati di tecnologia. Prodotto è al centro, con particolare attenzione ai dettagli di design. Uso di tonalità metalliche. Ambientazione urbana e moderna. Immagine che evidenzia le funzioni chiave: multitouch, connettività avanzata, fotocamera. Il risultato evoca innovazione e lusso Gradito design minimal e futuristico”

 

Ecco il risultato: le prime due immagini sono state generate con Dall-e, le ultime con FireFly:

 

Ecco invece cosa succede utilizzando un altro prompt, stavolta redatto in modo dettagliato, ma più libero:

 

“Crea un’immagine reale fotorealistica di un truck aziendale con grafiche geometriche, usando come sfondo piazza Vittorio Veneto a Torino, con sullo sfondo la chiesa della Gran Madre. L’azienda è un’azienda del settore logistico, il truck è un furgoncino da trasporto, i colori del brand sono blu, bianco e rosso, l’effetto deve essere molto professionale, come se dovessimo usarlo per una campagna sui quotidiani”.

 

Anche in questo caso, le prime due immagini sono state generate con Dall-e, le ultime con FireFly. Il riferimento ad un luogo fisico esistente è un elemento che l’intelligenza artificiale è riuscita a gestire, ma non in modo ottimale. Per migliorare la resa, alcuni strumenti più avanzati danno la possibilità di caricare, durante il processo generativo immagini o fonti che possano dare ulteriori elementi su cui lavorare all’algoritmo.

 

Ecco infine alcune immagini che il team grafico di Agenzia Perazza ha sviluppato con l’assistenza dell’intelligenza artificiale. Si tratta delle grafiche per post social che realizziamo per Benetton Rugby, con l’obiettivo di annunciare i diversi match che vedono la squadra coinvolta a livello internazionale. Dopo un brief accurato con il cliente, per ciascuna partita creiamo un’immagine diversa, in base al luogo e alla squadra da affrontare. Ogni settimana, di conseguenza, il post del match day cambia, accompagnato da una grafica dal forte impatto visivo che genera attesa e curiosità nei tifosi.

 

 

Il video qui sotto, in particolare, mostra come abbiamo lavorato per creare l’immagine che annuncia il match internazionale in cui si scontrano la squadra trevigiana e quella del Montpellier.

 

 

Cerchi un’agenzia di comunicazione e grafica al passo con le nuove tendenze che affianchi la tua impresa? Contattaci e parlaci del tuo progetto!

Ti abbiamo incuriosito? Siamo pronti ad ascoltarti: parlaci del tuo progetto!