Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt

Use this file to discover all available pages before exploring further.

Schätzen Sie die Kosten vor einem Modellaufruf, indem Sie den Preis aus dem Modellverzeichnis mit den Einheiten kombinieren, die der Endpoint abrechnet: Tokens, Bilder, Audiolänge oder Video-Tasks. Behandeln Sie die Schätzung als Budgetschutz und verwenden Sie nach Abschluss der Anfrage die tatsächlichen Nutzungs- und Abrechnungsdaten.

Token-basierte Aufrufe schätzen

Das folgende Python-Beispiel schätzt die Kosten einer token-basierten Anfrage anhand konfigurierter Preiswerte:
import math
import os

prompt = "Write a short product description for CometAPI."
max_output_tokens = 200

input_price_per_1m = float(os.environ["MODEL_INPUT_PRICE_PER_1M"])
output_price_per_1m = float(os.environ["MODEL_OUTPUT_PRICE_PER_1M"])

estimated_input_tokens = math.ceil(len(prompt) / 4)

estimated_cost = (
    estimated_input_tokens * input_price_per_1m
    + max_output_tokens * output_price_per_1m
) / 1_000_000

print(f"Estimated maximum cost: ${estimated_cost:.6f}")
Das Ergebnis ist eine Schätzung vor dem Aufruf:
Estimated maximum cost: $0.000123

Ein maximales Ausgabebudget festlegen

Die folgende Anfrage begrenzt die generierte Ausgabe, damit die Schätzung eine Obergrenze hat:
curl https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "your-model-id",
    "messages": [
      {
        "role": "user",
        "content": "Write a short product description for CometAPI."
      }
    ],
    "max_completion_tokens": 200
  }'
Die Antwort enthält die tatsächliche usage nach dem Modellaufruf:
{
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 42,
    "total_tokens": 52
  }
}

Task-basierte Aufrufe schätzen

Das folgende JavaScript-Beispiel schätzt einen task-basierten Workflow wie Bild- oder Videogenerierung:
const taskCount = 3;
const pricePerTask = Number(process.env.MODEL_PRICE_PER_TASK);

const estimatedCost = taskCount * pricePerTask;

console.log(`Estimated maximum cost: $${estimatedCost.toFixed(4)}`);
Das Ergebnis ist das Task-Budget:
Estimated maximum cost: $0.4500

Häufige Fehler

FehlerLösung
Verwendung eines Preises vom falschen ModellÜbernehmen Sie die Preise aus dem Modellverzeichnis desselben model ID.
Ausgabe-Tokens ignorierenLegen Sie max_completion_tokens oder das endpoint-spezifische Ausgabelimit fest.
Schätzungen als Rechnungen behandelnVergleichen Sie Schätzungen nach dem Aufruf mit der tatsächlichen usage.
Fehlende Task-MultiplikatorenPrüfen Sie bei Bild, Audio und Video, ob pro Task, pro Sekunde oder pro generiertem Asset abgerechnet wird.
Last modified on May 28, 2026