- Generazione text-to-image
- Modifica image-to-image
- Composizione multi-immagine
- Salvataggio delle immagini generate
- Base URL:
https://api.cometapi.com - Installa l’SDK:
pip install google-genai(Python) onpm install @google/genai(Node.js)
Configurazione
Inizializza il client con il base URL di CometAPI:Generazione Text-to-Image
Genera un’immagine da un prompt di testo e salvala in un file.candidates[0].content.parts, che può contenere parti di testo e/o immagine:
Generazione Image-to-Image
Carica un’immagine di input e trasformala con un prompt di testo.- L’SDK Python accetta direttamente oggetti
PIL.Image— non è necessaria alcuna codifica Base64 manuale. - Non includere il prefisso
data:image/jpeg;base64,quando passi stringhe Base64 raw.
Composizione multi-immagine
Genera una nuova immagine a partire da più immagini di input. CometAPI supporta due approcci:Metodo 1: Un’unica immagine collage
Combina più immagini sorgente in un unico collage, quindi descrivi l’output desiderato.

Metodo 2: Più immagini separate (fino a 14)
Passa più immagini direttamente. I modelli Gemini 3 supportano fino a 14 immagini di riferimento (oggetti + personaggi):
Generazione di immagini 4K
Specificaimage_config con aspect_ratio e image_size per un output ad alta risoluzione:
Modifica di immagini multi-turno (Chat)
Usa la funzionalità di chat dell’SDK per perfezionare iterativamente le immagini:Suggerimenti
Ottimizzazione del Prompt
Ottimizzazione del Prompt
Specifica parole chiave di stile (ad es. “cyberpunk, grana della pellicola, basso contrasto”), aspect ratio, soggetto, sfondo, illuminazione e livello di dettaglio.
Formato Base64
Formato Base64
Quando usi HTTP raw, non includere il prefisso
data:image/png;base64, — usa solo la stringa Base64 raw. L’SDK Python gestisce questo automaticamente con oggetti PIL.Image.Forzare l'output immagine
Forzare l'output immagine
Imposta
"responseModalities" su solo ["IMAGE"] per garantire l’output di immagini senza testo.