Gemini Generating Content
Use o formato de API nativo do Gemini por meio do CometAPI para geração de texto, entrada multimodal, thinking/reasoning, function calling, grounding com Google Search, modo JSON e streaming.
O CometAPI oferece suporte ao formato de API nativo do Gemini, dando a você acesso total a recursos específicos do Gemini, como controle de thinking, grounding com Google Search, modalidades nativas de geração de imagem e muito mais. Use este endpoint quando precisar de capacidades que não estão disponíveis por meio do endpoint de chat compatível com OpenAI.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
x-goog-api-key quanto Authorization: Bearer são compatíveis para autenticação.Início rápido
Para usar qualquer SDK do Gemini ou cliente HTTP com o CometAPI, substitua a URL base e a chave de API:| Configuração | Padrão do Google | CometAPI |
|---|---|---|
| URL base | generativelanguage.googleapis.com | api.cometapi.com |
| Chave de API | $GEMINI_API_KEY | $COMETAPI_KEY |
Configurar thinking (reasoning)
Os modelos Gemini podem realizar reasoning interno antes de gerar uma resposta. O método de controle depende da geração do modelo.- Gemini 3 (thinkingLevel)
- Gemini 2.5 (thinkingBudget)
thinkingLevel para controlar a profundidade do reasoning. Níveis disponíveis: MINIMAL, LOW, MEDIUM, HIGH.Use gemini-3-flash-preview como model de exemplo padrão, a menos que você precise especificamente de uma variante diferente do Gemini 3.Respostas em streaming
Para receber Server-Sent Events enquanto o modelo gera conteúdo, usestreamGenerateContent?alt=sse como operator. Cada evento SSE contém uma linha data: com um objeto JSON GenerateContentResponse.
Definir instruções de sistema
Para orientar o comportamento do modelo ao longo de toda a conversa, usesystemInstruction:
Solicitar saída JSON
Para forçar uma saída JSON estruturada, definaresponseMimeType. Opcionalmente, forneça um responseSchema para validação rigorosa de schema:
Fazer grounding com Google Search
Para habilitar pesquisa na web em tempo real, adicione uma ferramentagoogleSearch:
groundingMetadata com URLs de origem e pontuações de confiança.
Exemplo de resposta
Uma resposta típica do endpoint Gemini do CometAPI:thoughtsTokenCount em usageMetadata mostra quantos tokens o modelo gastou em reasoning interno, mesmo quando a saída de thinking não é incluída na resposta.Comparar com o endpoint compatível com OpenAI
| Recurso | Gemini nativo (/v1beta/models/...) | Compatível com OpenAI (/v1/chat/completions) |
|---|---|---|
| Controle de thinking | thinkingConfig com thinkingLevel / thinkingBudget | Não disponível |
| Grounding com Google Search | tools: [\{"google_search": \{\}\}] | Não disponível |
| Grounding com Google Maps | tools: [\{"googleMaps": \{\}\}] | Não disponível |
| Modalidade de geração de imagem | responseModalities: ["IMAGE"] | Não disponível |
| Header de autenticação | x-goog-api-key ou Bearer | Apenas Bearer |
| Formato de resposta | Gemini nativo (candidates, parts) | Formato OpenAI (choices, message) |
Autorizações
Your CometAPI key passed via the x-goog-api-key header. Bearer token authentication (Authorization: Bearer <key>) is also supported.
Parâmetros de caminho
Gemini model ID. Example: gemini-3-flash-preview, gemini-2.5-pro. See the Models page for current options.
The operation to perform. Use generateContent for synchronous responses, or streamGenerateContent?alt=sse for Server-Sent Events streaming.
generateContent, streamGenerateContent?alt=sse Corpo
System instructions that guide the model's behavior across the entire conversation. Text only.
Tools the model may use to generate responses. Supports function declarations, Google Search, Google Maps, and code execution.
Configuration for tool usage, such as function calling mode.
Safety filter settings. Override default thresholds for specific harm categories.
Configuration for model generation behavior including temperature, output length, and response format.
The name of cached content to use as context. Format: cachedContents/{id}. See the Gemini context caching documentation for details.
Resposta
Successful response. For streaming requests, the response is a stream of SSE events, each containing a GenerateContentResponse JSON object prefixed with data:.
The generated response candidates.
Feedback on the prompt, including safety blocking information.
Token usage statistics for the request.
The model version that generated this response.
The timestamp when this response was created (ISO 8601 format).
Unique identifier for this response.