- Генерація text-to-image
- Редагування image-to-image
- Композиція з кількох зображень
- Збереження згенерованих зображень
- Base URL:
https://api.cometapi.com - Встановіть SDK:
pip install google-genai(Python) абоnpm install @google/genai(Node.js)
Налаштування
Ініціалізуйте клієнт із base URL CometAPI:Генерація text-to-image
Згенеруйте зображення з текстового Prompt і збережіть його у файл.candidates[0].content.parts, який може містити текстові частини та/або частини зображення:
Генерація image-to-image
Завантажте вхідне зображення та трансформуйте його за допомогою текстового Prompt.- Python SDK напряму приймає об’єкти
PIL.Image— ручне кодування в Base64 не потрібне. - Не додавайте префікс
data:image/jpeg;base64,під час передавання необроблених рядків Base64.
Композиція з кількох зображень
Створіть нове зображення з кількох вхідних зображень. CometAPI підтримує два підходи:Метод 1: Один колаж
Об’єднайте кілька вихідних зображень в один колаж, а потім опишіть бажаний результат.

Метод 2: Кілька окремих зображень (до 14)
Передавайте кілька зображень безпосередньо. Моделі Gemini 3 підтримують до 14 еталонних зображень (об’єкти + персонажі):
Генерація зображень 4K
Вкажітьimage_config з aspect_ratio та image_size для виводу у високій роздільній здатності:
Багатокрокове редагування зображень (chat)
Використовуйте функцію chat в SDK, щоб ітеративно вдосконалювати зображення:Поради
Оптимізація Prompt
Оптимізація Prompt
Укажіть ключові слова стилю (наприклад, “cyberpunk, film grain, low contrast”), співвідношення сторін, об’єкт, фон, освітлення та рівень деталізації.
Формат Base64
Формат Base64
Під час використання сирого HTTP не додавайте префікс
data:image/png;base64, — використовуйте лише сирий рядок Base64. Python SDK обробляє це автоматично за допомогою об’єктів PIL.Image.Примусовий вивід зображення
Примусовий вивід зображення
Установіть
"responseModalities" лише в ["IMAGE"], щоб гарантувати вивід зображення без тексту.