Gemini Generating Content
استخدم تنسيق Gemini native API عبر CometAPI لتوليد النصوص، والإدخال متعدد الوسائط، والتفكير/الاستدلال، وFunction Calling، وربط Google Search، ووضع JSON، وStreaming.
x-goog-api-key وAuthorization: Bearer مدعومان للمصادقة.بداية سريعة
لاستخدام أي Gemini SDK أو عميل HTTP مع CometAPI، استبدل عنوان URL الأساسي ومفتاح API:| Setting | Google Default | CometAPI |
|---|---|---|
| الإعداد | الإعداد الافتراضي لـ Google | CometAPI |
| Base URL | generativelanguage.googleapis.com | api.cometapi.com |
| API Key | $GEMINI_API_KEY | $COMETAPI_KEY |
إرسال إدخال فيديو
يقبلgenerateContent في Gemini الفيديو كجزء من المحتوى. اختر شكل الإدخال بناءً على مكان تخزين الفيديو:
| Video source | Request part | Use when |
|---|---|---|
| ملف فيديو محلي | inlineData | يكون الفيديو صغيرًا بما يكفي لإرساله بصيغة base64 ضمن طلب JSON. |
| عنوان URL عام للفيديو | fileData.fileUri | يكون الفيديو متاحًا عبر عنوان URL عام باستخدام HTTPS ولا يتطلب مصادقة. |
inlineData.mimeType وfileData.fileUri. لا ترسل وسائط URL بصيغة file_data.file_uri.fileData.fileUri:
generateContent نفسه باستخدام inlineData أو fileData.fileUri.
تكوين التفكير (reasoning)
يمكن لنماذج Gemini تنفيذ reasoning داخلي قبل توليد الرد. تعتمد طريقة التحكم على إصدار النموذج.- Gemini 3 (thinkingLevel)
- Gemini 2.5 (thinkingBudget)
thinkingLevel للتحكم في عمق reasoning. المستويات المتاحة: MINIMAL, LOW, MEDIUM, HIGH.استخدم gemini-3-flash-preview كـ نموذج المثال الافتراضي ما لم تكن تحتاج تحديدًا إلى variant مختلف من Gemini 3.بث الردود
لتلقي Server-Sent Events أثناء توليد النموذج للمحتوى، استخدمstreamGenerateContent?alt=sse كـ operator. يحتوي كل حدث SSE على سطر data: مع كائن GenerateContentResponse بصيغة JSON.
تعيين تعليمات النظام
لتوجيه سلوك النموذج عبر المحادثة بالكامل، استخدمsystemInstruction:
إخراج JSON للطلب
لفرض إخراج JSON منظّم، عيّنresponseMimeType. ويمكنك اختياريًا توفير responseSchema للتحقق الصارم من المخطط:
Ground with Google Search
لتمكين البحث على الويب في الوقت الفعلي، أضف أداةgoogleSearch:
groundingMetadata مع عناوين URLs للمصادر ودرجات الثقة.
مثال على الاستجابة
استجابة نموذجية من نقطة نهاية Gemini في CometAPI:thoughtsTokenCount في usageMetadata يوضح عدد الـ tokens التي استهلكها النموذج في الاستدلال الداخلي، حتى عندما لا يكون إخراج التفكير مضمنًا في الاستجابة.المقارنة مع نقطة نهاية متوافقة مع OpenAI
| الميزة | Gemini Native (/v1beta/models/...) | OpenAI-Compatible (/v1/chat/completions) |
|---|---|---|
| التحكم في Thinking | thinkingConfig مع thinkingLevel / thinkingBudget | غير متاح |
| ربط Google Search | tools: [\{"google_search": \{\}\}] | غير متاح |
| ربط Google Maps | tools: [\{"googleMaps": \{\}\}] | غير متاح |
| نمط توليد الصور | responseModalities: ["IMAGE"] | غير متاح |
| ترويسة المصادقة | x-goog-api-key أو Bearer | Bearer فقط |
| تنسيق الاستجابة | Gemini native (candidates, parts) | تنسيق OpenAI (choices, message) |
التفويضات
Your CometAPI key passed via the x-goog-api-key header. Bearer token authentication (Authorization: Bearer $COMETAPI_KEY) is also supported.
معلمات المسار
Gemini model ID. Example: gemini-3-flash-preview, gemini-2.5-pro. See the Models page for current options.
The operation to perform. Use generateContent for synchronous responses, or streamGenerateContent?alt=sse for Server-Sent Events streaming.
generateContent, streamGenerateContent?alt=sse الجسم
System instructions that guide the model's behavior across the entire conversation. Text only.
Tools the model may use to generate responses. Supports function declarations, Google Search, Google Maps, and code execution.
Configuration for tool usage, such as function calling mode.
Safety filter settings. Override default thresholds for specific harm categories.
Configuration for model generation behavior including temperature, output length, and response format.
The name of cached content to use as context. Format: cachedContents/{id}. See the Gemini context caching documentation for details.
الاستجابة
Successful response. For streaming requests, the response is a stream of SSE events, each containing a GenerateContentResponse JSON object prefixed with data:.
The generated response candidates.
Feedback on the prompt, including safety blocking information.
Token usage statistics for the request.
The model version that generated this response.
The timestamp when this response was created (ISO 8601 format).
Unique identifier for this response.