- Generowanie obrazów z tekstu
- Edycję obrazu na podstawie obrazu
- Kompozycję wielu obrazów
- Zapisywanie wygenerowanych obrazów
- Base URL:
https://api.cometapi.com - Zainstaluj SDK:
pip install google-genai(Python) lubnpm install @google/genai(Node.js)
Konfiguracja
Zainicjalizuj klienta z użyciem bazowego adresu URL CometAPI:Generowanie obrazu z tekstu
Wygeneruj obraz na podstawie promptu tekstowego i zapisz go do pliku.candidates[0].content.parts, które mogą zawierać części tekstowe i/lub części obrazu:
Generowanie obraz-do-obrazu
Prześlij obraz wejściowy i przekształć go za pomocą tekstowego Prompt.- Python SDK akceptuje obiekty
PIL.Imagebezpośrednio — nie jest potrzebne ręczne kodowanie Base64. - Nie dołączaj prefiksu
data:image/jpeg;base64,podczas przekazywania surowych ciągów Base64.
Kompozycja z wielu obrazów
Wygeneruj nowy obraz z wielu obrazów wejściowych. CometAPI obsługuje dwa podejścia:Metoda 1: Pojedynczy obraz kolażu
Połącz wiele obrazów źródłowych w jeden kolaż, a następnie opisz oczekiwany wynik.

Metoda 2: Wiele oddzielnych obrazów (do 14)
Przekaż wiele obrazów bezpośrednio. Modele Gemini 3 obsługują do 14 obrazów referencyjnych (obiektów + postaci):
Generowanie obrazów 4K
Określimage_config z aspect_ratio i image_size, aby uzyskać wyjście w wysokiej rozdzielczości:
Edycja obrazów w wielu turach (chat)
Użyj funkcji chat w SDK, aby iteracyjnie dopracowywać obrazy:Wskazówki
Optymalizacja Promptu
Optymalizacja Promptu
Określ słowa kluczowe stylu (np. “cyberpunk, film grain, low contrast”), proporcje obrazu, temat, tło, oświetlenie i poziom szczegółowości.
Format Base64
Format Base64
Podczas używania surowego HTTP nie dołączaj prefiksu
data:image/png;base64, — używaj wyłącznie surowego ciągu Base64. Python SDK obsługuje to automatycznie za pomocą obiektów PIL.Image.Wymuszenie wyjścia obrazu
Wymuszenie wyjścia obrazu
Ustaw
"responseModalities" tylko na ["IMAGE"], aby zagwarantować wyjście obrazu bez tekstu.