- Text-zu-Bild-Generierung
- Bild-zu-Bild-Bearbeitung
- Komposition aus mehreren Bildern
- Generierte Bilder speichern
- Base URL:
https://api.cometapi.com - SDK installieren:
pip install google-genai(Python) odernpm install @google/genai(Node.js)
Setup
Initialisiere den Client mit der Base URL von CometAPI:Text-to-image-Generierung
Erzeugen Sie ein Bild aus einem Text-Prompt und speichern Sie es in einer Datei.candidates[0].content.parts, die Text- und/oder Bildteile enthalten können:
Bild-zu-Bild-Generierung
Laden Sie ein Eingabebild hoch und transformieren Sie es mit einem Text-Prompt.- Das Python SDK akzeptiert
PIL.Image-Objekte direkt — keine manuelle Base64-Kodierung erforderlich. - Fügen Sie nicht das Präfix
data:image/jpeg;base64,ein, wenn Sie rohe Base64-Strings übergeben.
Multi-image-Komposition
Erstellen Sie ein neues Bild aus mehreren Eingabebildern. CometAPI unterstützt zwei Ansätze:Methode 1: Einzelnes Collage-Bild
Kombinieren Sie mehrere Quellbilder zu einer Collage und beschreiben Sie dann die gewünschte Ausgabe.

Methode 2: Mehrere separate Bilder (bis zu 14)
Übergeben Sie mehrere Bilder direkt. Gemini 3-Modelle unterstützen bis zu 14 Referenzbilder (Objekte + Charaktere):
4K-Bildgenerierung
Geben Sieimage_config mit aspect_ratio und image_size für eine hochauflösende Ausgabe an:
Multi-turn-Bildbearbeitung (Chat)
Verwenden Sie die Chat-Funktion des SDK, um Bilder iterativ zu verfeinern:Tipps
Prompt-Optimierung
Prompt-Optimierung
Gib Stil-Keywords an (z. B. „cyberpunk, film grain, low contrast“), Seitenverhältnis, Motiv, Hintergrund, Beleuchtung und Detailgrad.
Base64-Format
Base64-Format
Wenn du rohes HTTP verwendest, füge nicht das Präfix
data:image/png;base64, hinzu — verwende nur den rohen Base64-String. Das Python SDK übernimmt dies mit PIL.Image-Objekten automatisch.Bildausgabe erzwingen
Bildausgabe erzwingen
Setze
"responseModalities" nur auf ["IMAGE"], um eine Bildausgabe ohne Text zu garantieren.