Schat verzoekkosten voordat je een model aanroept

Schat de kosten vóór een modelaanroep door de prijs uit de modeldirectory te combineren met de eenheden die het endpoint factureert: tokens, afbeeldingen, audiolengte of videotaken. Beschouw de schatting als een budgetbewaker en gebruik daarna de werkelijke gebruiks- en factureringsgegevens nadat het verzoek is voltooid.

Schat token-based aanroepen

Het volgende Python-voorbeeld schat de kosten van een token-based verzoek op basis van geconfigureerde prijswaarden:

import math
import os

prompt = "Write a short product description for CometAPI."
max_output_tokens = 200

input_price_per_1m = float(os.environ["MODEL_INPUT_PRICE_PER_1M"])
output_price_per_1m = float(os.environ["MODEL_OUTPUT_PRICE_PER_1M"])

estimated_input_tokens = math.ceil(len(prompt) / 4)

estimated_cost = (
    estimated_input_tokens * input_price_per_1m
    + max_output_tokens * output_price_per_1m
) / 1_000_000

print(f"Estimated maximum cost: ${estimated_cost:.6f}")

Het resultaat is een schatting vóór de aanroep:

Estimated maximum cost: $0.000123

Stel een maximaal uitvoerbudget in

Het volgende verzoek begrenst de gegenereerde uitvoer zodat de schatting een bovengrens heeft:

curl https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "your-model-id",
    "messages": [
      {
        "role": "user",
        "content": "Write a short product description for CometAPI."
      }
    ],
    "max_completion_tokens": 200
  }'

De response bevat het werkelijke gebruik na de modelaanroep:

{
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 42,
    "total_tokens": 52
  }
}

Schat task-based aanroepen

Het volgende JavaScript-voorbeeld schat een task-based workflow zoals het genereren van afbeeldingen of video:

const taskCount = 3;
const pricePerTask = Number(process.env.MODEL_PRICE_PER_TASK);

const estimatedCost = taskCount * pricePerTask;

console.log(`Estimated maximum cost: $${estimatedCost.toFixed(4)}`);

Het resultaat is het takenbudget:

Estimated maximum cost: $0.4500

Veelvoorkomende fouten

Error	Fix
Een prijs van het verkeerde model gebruiken	Kopieer de prijsinformatie van dezelfde model ID uit de modeldirectory.
Output tokens negeren	Stel `max_completion_tokens` of de endpoint-specifieke uitvoerlimiet in.
Schattingen behandelen als facturen	Vergelijk schattingen met het werkelijke gebruik na de aanroep.
Taakvermenigvuldigers ontbreken	Controleer voor afbeeldingen, audio en video of facturering per taak, per seconde of per gegenereerde asset plaatsvindt.

Begin hier

Snelstarts voor model-API's

Kernhandleidingen voor de API

Bibliotheken

Fouten

Prijzen en facturering

Ondersteuning

Schat verzoekkosten voordat je een model aanroept

Schat token-based aanroepen

Stel een maximaal uitvoerbudget in

Schat task-based aanroepen

Veelvoorkomende fouten

Gerelateerde links

​Schat token-based aanroepen

​Stel een maximaal uitvoerbudget in

​Schat task-based aanroepen

​Veelvoorkomende fouten

​Gerelateerde links

Schat token-based aanroepen

Stel een maximaal uitvoerbudget in

Schat task-based aanroepen

Veelvoorkomende fouten

Gerelateerde links