Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt

Use this file to discover all available pages before exploring further.

Estimez le coût avant un appel à un modèle en combinant le prix du répertoire de modèles avec les unités facturées par le endpoint : tokens, images, durée audio ou tâches vidéo. Considérez cette estimation comme une protection budgétaire, puis utilisez l’usage réel et les relevés de facturation une fois la requête terminée.

Estimer les appels basés sur les tokens

L’exemple Python suivant estime le coût d’une requête basée sur des tokens à partir de valeurs de tarification configurées :
import math
import os

prompt = "Write a short product description for CometAPI."
max_output_tokens = 200

input_price_per_1m = float(os.environ["MODEL_INPUT_PRICE_PER_1M"])
output_price_per_1m = float(os.environ["MODEL_OUTPUT_PRICE_PER_1M"])

estimated_input_tokens = math.ceil(len(prompt) / 4)

estimated_cost = (
    estimated_input_tokens * input_price_per_1m
    + max_output_tokens * output_price_per_1m
) / 1_000_000

print(f"Estimated maximum cost: ${estimated_cost:.6f}")
Le résultat est une estimation avant l’appel :
Estimated maximum cost: $0.000123

Définir un budget de sortie maximal

La requête suivante plafonne la sortie générée afin que l’estimation ait une borne supérieure :
curl https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "your-model-id",
    "messages": [
      {
        "role": "user",
        "content": "Write a short product description for CometAPI."
      }
    ],
    "max_completion_tokens": 200
  }'
La réponse inclut l’usage réel après l’appel au modèle :
{
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 42,
    "total_tokens": 52
  }
}

Estimer les appels basés sur des tâches

L’exemple JavaScript suivant estime un workflow basé sur des tâches, comme la génération d’images ou de vidéos :
const taskCount = 3;
const pricePerTask = Number(process.env.MODEL_PRICE_PER_TASK);

const estimatedCost = taskCount * pricePerTask;

console.log(`Estimated maximum cost: $${estimatedCost.toFixed(4)}`);
Le résultat est le budget de la tâche :
Estimated maximum cost: $0.4500

Erreurs courantes

ErreurCorrection
Utiliser un prix provenant du mauvais modèleCopiez la tarification du même model ID dans le répertoire de modèles.
Ignorer les tokens de sortieDéfinissez max_completion_tokens ou la limite de sortie spécifique au endpoint.
Traiter les estimations comme des facturesComparez les estimations avec l’usage réel après l’appel.
Oublier les multiplicateurs de tâchesPour l’image, l’audio et la vidéo, vérifiez si la facturation se fait par tâche, par seconde ou par ressource générée.

Liens associés

Last modified on May 28, 2026