Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
モデル呼び出し前のコストは、モデルディレクトリの価格と、そのエンドポイントで課金される単位(トークン(Token)、画像、音声の長さ、動画タスク)を組み合わせて見積もります。この見積もりは予算のガードとして扱い、リクエスト完了後は実際の usage と billing records を使用してください。
トークンベースの呼び出しを見積もる
次の Python 例は、設定された料金値からトークンベースのリクエストコストを見積もります。
import math
import os
prompt = "Write a short product description for CometAPI."
max_output_tokens = 200
input_price_per_1m = float(os.environ["MODEL_INPUT_PRICE_PER_1M"])
output_price_per_1m = float(os.environ["MODEL_OUTPUT_PRICE_PER_1M"])
estimated_input_tokens = math.ceil(len(prompt) / 4)
estimated_cost = (
estimated_input_tokens * input_price_per_1m
+ max_output_tokens * output_price_per_1m
) / 1_000_000
print(f"Estimated maximum cost: ${estimated_cost:.6f}")
結果は呼び出し前の見積もりです。
Estimated maximum cost: $0.000123
最大出力予算を設定する
次のリクエストでは生成される出力に上限を設定し、見積もりに上限値を持たせます。
curl https://api.cometapi.com/v1/chat/completions \
-H "Authorization: Bearer $COMETAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "your-model-id",
"messages": [
{
"role": "user",
"content": "Write a short product description for CometAPI."
}
],
"max_completion_tokens": 200
}'
レスポンスには、モデル呼び出し後の実際の usage が含まれます。
{
"usage": {
"prompt_tokens": 10,
"completion_tokens": 42,
"total_tokens": 52
}
}
タスクベースの呼び出しを見積もる
次の JavaScript 例は、画像生成や動画生成のようなタスクベースのワークフローを見積もります。
const taskCount = 3;
const pricePerTask = Number(process.env.MODEL_PRICE_PER_TASK);
const estimatedCost = taskCount * pricePerTask;
console.log(`Estimated maximum cost: $${estimatedCost.toFixed(4)}`);
結果はタスク予算です。
Estimated maximum cost: $0.4500
よくあるエラー
| エラー | 修正方法 |
|---|
| 誤ったモデルの価格を使用している | モデルディレクトリ内の同じ model ID の料金をコピーしてください。 |
| output tokens を無視している | max_completion_tokens またはエンドポイント固有の出力上限を設定してください。 |
| 見積もりを請求額として扱っている | 呼び出し後に、見積もりを実際の usage と比較してください。 |
| タスクの乗数が不足している | 画像、音声、動画では、課金単位がタスクごと、秒ごと、または生成されたアセットごとかを確認してください。 |
関連リンク