Gemini Generating Content
Verwenden Sie das native Gemini-API-Format über CometAPI für Textgenerierung, multimodale Eingaben, Thinking/Reasoning, Function Calling, Google Search Grounding, JSON-Modus und Streaming.
CometAPI unterstützt das native Gemini-API-Format und gibt Ihnen vollen Zugriff auf Gemini-spezifische Funktionen wie Thinking-Steuerung, Google Search Grounding, native Bildgenerierungsmodalitäten und mehr. Verwenden Sie diesen Endpunkt, wenn Sie Fähigkeiten benötigen, die über den OpenAI-kompatiblen Chat-Endpunkt nicht verfügbar sind.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
x-goog-api-key als auch Authorization: Bearer-Header werden für die Authentifizierung unterstützt.Schnellstart
Um ein beliebiges Gemini SDK oder einen HTTP-Client mit CometAPI zu verwenden, ersetzen Sie die Basis-URL und den API-Schlüssel:| Setting | Google-Standard | CometAPI |
|---|---|---|
| Basis-URL | generativelanguage.googleapis.com | api.cometapi.com |
| API-Schlüssel | $GEMINI_API_KEY | $COMETAPI_KEY |
Thinking konfigurieren (Reasoning)
Gemini-Modelle können internes Reasoning ausführen, bevor sie eine Antwort generieren. Die Steuerungsmethode hängt von der Modellgeneration ab.- Gemini 3 (thinkingLevel)
- Gemini 2.5 (thinkingBudget)
thinkingLevel, um die Reasoning-Tiefe zu steuern. Verfügbare Stufen: MINIMAL, LOW, MEDIUM, HIGH.Verwenden Sie gemini-3-flash-preview als Standard-Beispielmodell, sofern Sie nicht ausdrücklich eine andere Gemini-3-Variante benötigen.Responses streamen
Um Server-Sent Events zu empfangen, während das Modell Inhalte generiert, verwenden SiestreamGenerateContent?alt=sse als Operator. Jedes SSE-Ereignis enthält eine data:-Zeile mit einem JSON-Objekt vom Typ GenerateContentResponse.
Systemanweisungen festlegen
Um das Verhalten des Modells über die gesamte Konversation hinweg zu steuern, verwenden SiesystemInstruction:
JSON-Ausgabe anfordern
Um eine strukturierte JSON-Ausgabe zu erzwingen, setzen SieresponseMimeType. Optional können Sie responseSchema für eine strikte Schema-Validierung angeben:
Mit Google Search Grounding verwenden
Um die Websuche in Echtzeit zu aktivieren, fügen Sie eingoogleSearch-Tool hinzu:
groundingMetadata mit Quell-URLs und Konfidenzwerten.
Antwortbeispiel
Eine typische Antwort vom Gemini-Endpunkt von CometAPI:thoughtsTokenCount in usageMetadata zeigt, wie viele Tokens das Modell für internes Reasoning aufgewendet hat, auch wenn die Thinking-Ausgabe nicht in der Antwort enthalten ist.Vergleich mit dem OpenAI-kompatiblen Endpunkt
| Funktion | Gemini Native (/v1beta/models/...) | OpenAI-Compatible (/v1/chat/completions) |
|---|---|---|
| Thinking-Steuerung | thinkingConfig mit thinkingLevel / thinkingBudget | Nicht verfügbar |
| Google Search Grounding | tools: [\{"google_search": \{\}\}] | Nicht verfügbar |
| Google Maps Grounding | tools: [\{"googleMaps": \{\}\}] | Nicht verfügbar |
| Bildgenerierungs-Modalität | responseModalities: ["IMAGE"] | Nicht verfügbar |
| Auth-Header | x-goog-api-key oder Bearer | Nur Bearer |
| Antwortformat | Gemini-nativ (candidates, parts) | OpenAI-Format (choices, message) |
Autorisierungen
Your CometAPI key passed via the x-goog-api-key header. Bearer token authentication (Authorization: Bearer <key>) is also supported.
Pfadparameter
Gemini model ID. Example: gemini-3-flash-preview, gemini-2.5-pro. See the Models page for current options.
The operation to perform. Use generateContent for synchronous responses, or streamGenerateContent?alt=sse for Server-Sent Events streaming.
generateContent, streamGenerateContent?alt=sse Body
System instructions that guide the model's behavior across the entire conversation. Text only.
Tools the model may use to generate responses. Supports function declarations, Google Search, Google Maps, and code execution.
Configuration for tool usage, such as function calling mode.
Safety filter settings. Override default thresholds for specific harm categories.
Configuration for model generation behavior including temperature, output length, and response format.
The name of cached content to use as context. Format: cachedContents/{id}. See the Gemini context caching documentation for details.
Antwort
Successful response. For streaming requests, the response is a stream of SSE events, each containing a GenerateContentResponse JSON object prefixed with data:.
The generated response candidates.
Feedback on the prompt, including safety blocking information.
Token usage statistics for the request.
The model version that generated this response.
The timestamp when this response was created (ISO 8601 format).
Unique identifier for this response.