- Geração de texto para imagem
- Edição de imagem para imagem
- Composição com múltiplas imagens
- Salvamento de imagens geradas
- Base URL:
https://api.cometapi.com - Instale o SDK:
pip install google-genai(Python) ounpm install @google/genai(Node.js)
Configuração
Inicialize o cliente com a base URL do CometAPI:Geração de imagem a partir de texto
Gere uma imagem a partir de um prompt de texto e salve-a em um arquivo.candidates[0].content.parts, que pode conter partes de texto e/ou imagem:
Geração de imagem para imagem
Faça upload de uma imagem de entrada e transforme-a com um prompt de texto.- O SDK Python aceita objetos
PIL.Imagediretamente — não é necessário codificar manualmente em Base64. - Não inclua o prefixo
data:image/jpeg;base64,ao passar strings Base64 brutas.
Composição de múltiplas imagens
Gere uma nova imagem a partir de várias imagens de entrada. O CometAPI oferece suporte a duas abordagens:Método 1: Uma única imagem em colagem
Combine várias imagens de origem em uma única colagem e, em seguida, descreva a saída desejada.

Método 2: Várias imagens separadas (até 14)
Passe várias imagens diretamente. Os modelos Gemini 3 oferecem suporte a até 14 imagens de referência (objetos + personagens):
Geração de imagens em 4K
Especifiqueimage_config com aspect_ratio e image_size para saída em alta resolução:
Edição de imagens em múltiplos turnos (chat)
Use o recurso de chat do SDK para refinar imagens de forma iterativa:Dicas
Otimização de Prompt
Otimização de Prompt
Especifique palavras-chave de estilo (por exemplo, “cyberpunk, film grain, low contrast”), proporção, assunto, plano de fundo, iluminação e nível de detalhe.
Formato Base64
Formato Base64
Ao usar HTTP bruto, não inclua o prefixo
data:image/png;base64, — use apenas a string Base64 bruta. O SDK Python lida com isso automaticamente com objetos PIL.Image.Forçar saída de imagem
Forçar saída de imagem
Defina
"responseModalities" como ["IMAGE"] apenas para garantir saída de imagem sem texto.