Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
قدّر التكلفة قبل استدعاء model من خلال دمج سعر دليل النماذج مع الوحدات التي تُحتسب عليها الفوترة في endpoint: Tokens أو الصور أو مدة الصوت أو مهام الفيديو. تعامل مع التقدير على أنه وسيلة لضبط الميزانية، ثم استخدم سجلات الاستخدام الفعلي والفوترة بعد اكتمال الطلب.
تقدير الاستدعاءات المعتمدة على Token
يوضح مثال Python التالي كيفية تقدير تكلفة الطلبات المعتمدة على Token من قيم التسعير المُعدّة:
import math
import os
prompt = "Write a short product description for CometAPI."
max_output_tokens = 200
input_price_per_1m = float(os.environ["MODEL_INPUT_PRICE_PER_1M"])
output_price_per_1m = float(os.environ["MODEL_OUTPUT_PRICE_PER_1M"])
estimated_input_tokens = math.ceil(len(prompt) / 4)
estimated_cost = (
estimated_input_tokens * input_price_per_1m
+ max_output_tokens * output_price_per_1m
) / 1_000_000
print(f"Estimated maximum cost: ${estimated_cost:.6f}")
النتيجة هي تقدير قبل الاستدعاء:
Estimated maximum cost: $0.000123
تعيين حد أقصى لميزانية الإخراج
يضع الطلب التالي حدًا أقصى للإخراج المُولّد بحيث يكون للتقدير حد أعلى:
curl https://api.cometapi.com/v1/chat/completions \
-H "Authorization: Bearer $COMETAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "your-model-id",
"messages": [
{
"role": "user",
"content": "Write a short product description for CometAPI."
}
],
"max_completion_tokens": 200
}'
يتضمن الرد بيانات الاستخدام الفعلية بعد استدعاء model:
{
"usage": {
"prompt_tokens": 10,
"completion_tokens": 42,
"total_tokens": 52
}
}
تقدير الاستدعاءات المعتمدة على المهام
يوضح مثال JavaScript التالي كيفية تقدير سير عمل قائم على المهام مثل إنشاء الصور أو الفيديو:
const taskCount = 3;
const pricePerTask = Number(process.env.MODEL_PRICE_PER_TASK);
const estimatedCost = taskCount * pricePerTask;
console.log(`Estimated maximum cost: $${estimatedCost.toFixed(4)}`);
النتيجة هي ميزانية المهام:
Estimated maximum cost: $0.4500
الأخطاء الشائعة
| الخطأ | الحل |
|---|
| استخدام سعر من model غير صحيح | انسخ التسعير من model ID نفسه في دليل النماذج. |
| تجاهل Tokens الخاصة بالإخراج | عيّن max_completion_tokens أو حد الإخراج الخاص بـ endpoint. |
| التعامل مع التقديرات على أنها فواتير | قارن التقديرات بالاستخدام الفعلي بعد الاستدعاء. |
| عدم احتساب مضاعِفات المهام | بالنسبة للصور والصوت والفيديو، تحقق مما إذا كانت الفوترة تتم لكل مهمة أو لكل ثانية أو لكل أصل تم إنشاؤه. |
روابط ذات صلة