Gemini Generating Content
Використовуйте нативний формат API Gemini через CometAPI для генерації тексту, multimodal input, thinking/reasoning, function calling, Google Search grounding, режиму JSON і streaming.
CometAPI підтримує нативний формат API Gemini, надаючи вам повний доступ до специфічних для Gemini можливостей, як-от керування thinking, Google Search grounding, нативні модальності генерації зображень та інші. Використовуйте цей endpoint, коли вам потрібні можливості, недоступні через OpenAI-compatible chat endpoint.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
x-goog-api-key і Authorization: Bearer.Швидкий старт
Щоб використовувати будь-який SDK Gemini або HTTP-клієнт із CometAPI, замініть base URL і API key:| Налаштування | Google за замовчуванням | CometAPI |
|---|---|---|
| Base URL | generativelanguage.googleapis.com | api.cometapi.com |
| API Key | $GEMINI_API_KEY | $COMETAPI_KEY |
Налаштування thinking (reasoning)
Моделі Gemini можуть виконувати внутрішнє reasoning перед генерацією відповіді. Метод керування залежить від покоління моделі.- Gemini 3 (thinkingLevel)
- Gemini 2.5 (thinkingBudget)
thinkingLevel для керування глибиною reasoning. Доступні рівні: MINIMAL, LOW, MEDIUM, HIGH.Використовуйте gemini-3-flash-preview як модель прикладу за замовчуванням, якщо вам не потрібен конкретно інший варіант Gemini 3.Stream відповіді
Щоб отримувати Server-Sent Events у міру того, як модель генерує контент, використовуйтеstreamGenerateContent?alt=sse як operator. Кожна SSE-подія містить рядок data: з JSON-об’єктом GenerateContentResponse.
Задайте system instructions
Щоб спрямовувати поведінку моделі протягом усієї розмови, використовуйтеsystemInstruction:
JSON output для запиту
Щоб примусово отримати структурований JSON output, встановітьresponseMimeType. За бажанням можна також передати responseSchema для суворої валідації схеми:
Grounding із Google Search
Щоб увімкнути вебпошук у реальному часі, додайте інструментgoogleSearch:
groundingMetadata з URL-адресами джерел і оцінками впевненості.
Приклад відповіді
Типова відповідь від Gemini endpoint у CometAPI:thoughtsTokenCount у usageMetadata показує, скільки токенів модель витратила на внутрішнє міркування, навіть якщо thinking output не включено до відповіді.Порівняння з OpenAI-compatible endpoint
| Можливість | Gemini Native (/v1beta/models/...) | OpenAI-Compatible (/v1/chat/completions) |
|---|---|---|
| Керування thinking | thinkingConfig з thinkingLevel / thinkingBudget | Недоступно |
| Grounding через Google Search | tools: [\{"google_search": \{\}\}] | Недоступно |
| Grounding через Google Maps | tools: [\{"googleMaps": \{\}\}] | Недоступно |
| Модальність генерації зображень | responseModalities: ["IMAGE"] | Недоступно |
| Заголовок автентифікації | x-goog-api-key або Bearer | Лише Bearer |
| Формат відповіді | Gemini native (candidates, parts) | Формат OpenAI (choices, message) |
Авторизації
Your CometAPI key passed via the x-goog-api-key header. Bearer token authentication (Authorization: Bearer <key>) is also supported.
Параметри шляху
Gemini model ID. Example: gemini-3-flash-preview, gemini-2.5-pro. See the Models page for current options.
The operation to perform. Use generateContent for synchronous responses, or streamGenerateContent?alt=sse for Server-Sent Events streaming.
generateContent, streamGenerateContent?alt=sse Тіло
System instructions that guide the model's behavior across the entire conversation. Text only.
Tools the model may use to generate responses. Supports function declarations, Google Search, Google Maps, and code execution.
Configuration for tool usage, such as function calling mode.
Safety filter settings. Override default thresholds for specific harm categories.
Configuration for model generation behavior including temperature, output length, and response format.
The name of cached content to use as context. Format: cachedContents/{id}. See the Gemini context caching documentation for details.
Відповідь
Successful response. For streaming requests, the response is a stream of SSE events, each containing a GenerateContentResponse JSON object prefixed with data:.
The generated response candidates.
Feedback on the prompt, including safety blocking information.
Token usage statistics for the request.
The model version that generated this response.
The timestamp when this response was created (ISO 8601 format).
Unique identifier for this response.