Handleiding voor het aanroepen van Gemini-afbeeldingsmodellen

Deze handleiding laat zien hoe je Gemini-afbeeldingsmodellen via CometAPI gebruikt met de Google Gen AI SDK. Het behandelt:

Text-to-image-generatie
Image-to-image-bewerking
Compositie met meerdere afbeeldingen
Gegenereerde afbeeldingen opslaan

Base URL: https://api.cometapi.com
Installeer de SDK: pip install google-genai (Python) of npm install @google/genai (Node.js)

Setup

Initialiseer de client met de base URL van CometAPI:

from google import genai
from google.genai import types
import os

COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": "https://api.cometapi.com"},
    api_key=COMETAPI_KEY,
)

Text-to-Image-generatie

Genereer een afbeelding op basis van een tekstprompt en sla deze op in een bestand.

from google import genai
from google.genai import types
from PIL import Image
import os

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": "https://api.cometapi.com"},
    api_key=os.environ.get("COMETAPI_KEY"),
)

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme",
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
    ),
)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        image.save("generated_image.png")
        print("Image saved to generated_image.png")

Responsestructuur: De afbeeldingsdata staat in candidates[0].content.parts, die tekst- en/of afbeeldingselementen kan bevatten:

{
  "candidates": [{
    "content": {
      "parts": [
        { "text": "Here is your image..." },
        {
          "inlineData": {
            "mimeType": "image/png",
            "data": "<base64-encoded-image>"
          }
        }
      ]
    }
  }]
}

Image-to-Image Generation

Upload een invoerafbeelding en transformeer deze met een tekst Prompt.

from google import genai
from google.genai import types
from PIL import Image
import os

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": "https://api.cometapi.com"},
    api_key=os.environ.get("COMETAPI_KEY"),
)

# Load the source image
source_image = Image.open("source.jpg")

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=["Transform this into a watercolor painting", source_image],
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
    ),
)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        image.save("watercolor_output.png")

De Python SDK accepteert PIL.Image-objecten direct — handmatige Base64-codering is niet nodig.
Voeg niet het voorvoegsel data:image/jpeg;base64, toe wanneer je ruwe Base64-strings doorgeeft.

Compositie met meerdere afbeeldingen

Genereer een nieuwe afbeelding op basis van meerdere invoerafbeeldingen. CometAPI ondersteunt twee benaderingen:

Methode 1: Eén collage-afbeelding

Combineer meerdere bronafbeeldingen tot één collage en beschrijf vervolgens de gewenste uitvoer.

from google import genai
from google.genai import types
from PIL import Image
import os

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": "https://api.cometapi.com"},
    api_key=os.environ.get("COMETAPI_KEY"),
)

collage = Image.open("collage.jpg")

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[
        "A model is posing and leaning against a pink BMW with a green alien keychain attached to a pink handbag, a pink parrot on her shoulder, and a pug wearing a pink collar and gold headphones",
        collage,
    ],
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
    ),
)

for part in response.parts:
    if part.inline_data is not None:
        part.as_image().save("composition_output.png")

Methode 2: Meerdere losse afbeeldingen (tot 14)

Geef meerdere afbeeldingen rechtstreeks door. Gemini 3-modellen ondersteunen tot 14 referentieafbeeldingen (objecten + personages):

from google import genai
from google.genai import types
from PIL import Image
import os

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": "https://api.cometapi.com"},
    api_key=os.environ.get("COMETAPI_KEY"),
)

image1 = Image.open("image1.jpg")
image2 = Image.open("image2.jpg")
image3 = Image.open("image3.jpg")

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=["Merge the three images", image1, image2, image3],
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
    ),
)

for part in response.parts:
    if part.inline_data is not None:
        part.as_image().save("merged_output.png")

Resultaat van generatie met meerdere afbeeldingen

4K-afbeeldingsgeneratie

Specificeer image_config met aspect_ratio en image_size voor output met hoge resolutie:

from google import genai
from google.genai import types
import os

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": "https://api.cometapi.com"},
    api_key=os.environ.get("COMETAPI_KEY"),
)

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="Da Vinci style anatomical sketch of a Monarch butterfly on textured parchment",
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio="1:1",
            image_size="4K",
        ),
    ),
)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        image.save("butterfly_4k.png")

Multi-turn Image Editing (Chat)

Gebruik de chatfunctie van de SDK om afbeeldingen iteratief te verfijnen:

from google import genai
from google.genai import types
import os

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": "https://api.cometapi.com"},
    api_key=os.environ.get("COMETAPI_KEY"),
)

chat = client.chats.create(
    model="gemini-3.1-flash-image-preview",
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
    ),
)

# First turn: generate
response = chat.send_message(
    "Create a vibrant infographic explaining photosynthesis as a recipe, styled like a colorful kids cookbook"
)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        image.save("photosynthesis.png")

# Second turn: refine
response = chat.send_message("Update this infographic to be in Spanish. Do not change any other elements.")

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        image.save("photosynthesis_spanish.png")

Tips

Prompt Optimization

Specificeer stijlzoekwoorden (bijv. “cyberpunk, film grain, low contrast”), beeldverhouding, onderwerp, achtergrond, belichting en detailniveau.

Base64 Format

Bij gebruik van raw HTTP moet je niet de prefix data:image/png;base64, opnemen — gebruik alleen de ruwe Base64-string. De Python SDK verwerkt dit automatisch met PIL.Image-objecten.

Force Image Output

Stel "responseModalities" in op alleen ["IMAGE"] om beelduitvoer zonder tekst te garanderen.

Zie de API Reference voor meer details. Officiële documentatie: Gemini Image Generation

Gemini Image Understanding

Overzicht

API-referentie

Integratiehandleidingen

Fouten

Prijzen & facturatie

Ondersteuning

Handleiding voor het aanroepen van Gemini-afbeeldingsmodellen

Setup

Text-to-Image-generatie

Image-to-Image Generation

Compositie met meerdere afbeeldingen

Methode 1: Eén collage-afbeelding

Methode 2: Meerdere losse afbeeldingen (tot 14)

4K-afbeeldingsgeneratie

Multi-turn Image Editing (Chat)

Tips

Overzicht

API-referentie

Integratiehandleidingen

Fouten

Prijzen & facturatie

Ondersteuning

​Setup

​Text-to-Image-generatie

​Image-to-Image Generation

​Compositie met meerdere afbeeldingen

​Methode 1: Eén collage-afbeelding

​Methode 2: Meerdere losse afbeeldingen (tot 14)

​4K-afbeeldingsgeneratie

​Multi-turn Image Editing (Chat)

​Tips

Setup

Text-to-Image-generatie

Image-to-Image Generation

Compositie met meerdere afbeeldingen

Methode 1: Eén collage-afbeelding

Methode 2: Meerdere losse afbeeldingen (tot 14)

4K-afbeeldingsgeneratie

Multi-turn Image Editing (Chat)

Tips