Gemini Generating Content
Используйте нативный формат API Gemini через CometAPI для генерации текста, Multimodal-ввода, thinking/reasoning, Function Calling, grounding через Google Search, режима JSON и Streaming.
CometAPI поддерживает нативный формат API Gemini, предоставляя вам полный доступ к функциям, специфичным для Gemini, таким как управление thinking, grounding через Google Search, нативные modality генерации изображений и многое другое. Используйте этот endpoint, когда вам нужны возможности, недоступные через чат-эндпоинт, совместимый с OpenAI.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
x-goog-api-key и Authorization: Bearer.Быстрый старт
Чтобы использовать любой SDK Gemini или HTTP-клиент с CometAPI, замените базовый URL и API key:| Setting | Google Default | CometAPI |
|---|---|---|
| Base URL | generativelanguage.googleapis.com | api.cometapi.com |
| API Key | $GEMINI_API_KEY | $COMETAPI_KEY |
Настройка thinking (reasoning)
Модели Gemini могут выполнять внутреннее reasoning перед генерацией ответа. Метод управления зависит от поколения модели.- Gemini 3 (thinkingLevel)
- Gemini 2.5 (thinkingBudget)
thinkingLevel для управления глубиной reasoning. Доступные уровни: MINIMAL, LOW, MEDIUM, HIGH.Используйте gemini-3-flash-preview как модель-пример по умолчанию, если вам не нужен конкретный другой вариант Gemini 3.Потоковые ответы
Чтобы получать Server-Sent Events по мере генерации контента моделью, используйтеstreamGenerateContent?alt=sse в качестве operator. Каждое SSE-событие содержит строку data: с JSON-объектом GenerateContentResponse.
Задание system instructions
Чтобы направлять поведение модели на протяжении всего разговора, используйтеsystemInstruction:
Запрос вывода в JSON
Чтобы принудительно получить структурированный JSON-вывод, задайтеresponseMimeType. При необходимости можно также указать responseSchema для строгой валидации схемы:
Grounding через Google Search
Чтобы включить веб-поиск в реальном времени, добавьте инструментgoogleSearch:
groundingMetadata с URL-адресами источников и оценками уверенности.
Пример ответа
Типичный ответ от endpoint Gemini в CometAPI:thoughtsTokenCount в usageMetadata показывает, сколько Token модель потратила на внутреннее reasoning, даже если thinking-вывод не включён в ответ.Сравнение с endpoint, совместимым с OpenAI
| Feature | Gemini Native (/v1beta/models/...) | OpenAI-Compatible (/v1/chat/completions) |
|---|---|---|
| Thinking control | thinkingConfig with thinkingLevel / thinkingBudget | Недоступно |
| Google Search grounding | tools: [\{"google_search": \{\}\}] | Недоступно |
| Google Maps grounding | tools: [\{"googleMaps": \{\}\}] | Недоступно |
| Image generation modality | responseModalities: ["IMAGE"] | Недоступно |
| Auth header | x-goog-api-key or Bearer | Только Bearer |
| Response format | Gemini native (candidates, parts) | Формат OpenAI (choices, message) |
Авторизации
Your CometAPI key passed via the x-goog-api-key header. Bearer token authentication (Authorization: Bearer <key>) is also supported.
Параметры пути
Gemini model ID. Example: gemini-3-flash-preview, gemini-2.5-pro. See the Models page for current options.
The operation to perform. Use generateContent for synchronous responses, or streamGenerateContent?alt=sse for Server-Sent Events streaming.
generateContent, streamGenerateContent?alt=sse Тело
System instructions that guide the model's behavior across the entire conversation. Text only.
Tools the model may use to generate responses. Supports function declarations, Google Search, Google Maps, and code execution.
Configuration for tool usage, such as function calling mode.
Safety filter settings. Override default thresholds for specific harm categories.
Configuration for model generation behavior including temperature, output length, and response format.
The name of cached content to use as context. Format: cachedContents/{id}. See the Gemini context caching documentation for details.
Ответ
Successful response. For streaming requests, the response is a stream of SSE events, each containing a GenerateContentResponse JSON object prefixed with data:.
The generated response candidates.
Feedback on the prompt, including safety blocking information.
Token usage statistics for the request.
The model version that generated this response.
The timestamp when this response was created (ISO 8601 format).
Unique identifier for this response.