Estimez le coût avant un appel à un modèle en combinant le prix du répertoire de modèles avec les unités facturées par le endpoint : tokens, images, durée audio ou tâches vidéo. Considérez cette estimation comme une protection budgétaire, puis utilisez l’usage réel et les relevés de facturation une fois la requête terminée.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
Estimer les appels basés sur les tokens
L’exemple Python suivant estime le coût d’une requête basée sur des tokens à partir de valeurs de tarification configurées :Définir un budget de sortie maximal
La requête suivante plafonne la sortie générée afin que l’estimation ait une borne supérieure :Estimer les appels basés sur des tâches
L’exemple JavaScript suivant estime un workflow basé sur des tâches, comme la génération d’images ou de vidéos :Erreurs courantes
| Erreur | Correction |
|---|---|
| Utiliser un prix provenant du mauvais modèle | Copiez la tarification du même model ID dans le répertoire de modèles. |
| Ignorer les tokens de sortie | Définissez max_completion_tokens ou la limite de sortie spécifique au endpoint. |
| Traiter les estimations comme des factures | Comparez les estimations avec l’usage réel après l’appel. |
| Oublier les multiplicateurs de tâches | Pour l’image, l’audio et la vidéo, vérifiez si la facturation se fait par tâche, par seconde ou par ressource générée. |