Estima el costo antes de llamar a un modelo combinando el precio del directorio de modelos con las unidades que factura el endpoint: tokens, imágenes, duración de audio o tareas de video. Considera la estimación como una protección de presupuesto y luego usa el uso real y los registros de facturación después de que la solicitud se complete.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
Estimar llamadas basadas en tokens
El siguiente ejemplo en Python estima el costo de una solicitud basada en tokens a partir de valores de precios configurados:Establecer un presupuesto máximo de salida
La siguiente solicitud limita la salida generada para que la estimación tenga un límite superior:Estimar llamadas basadas en tareas
El siguiente ejemplo en JavaScript estima un flujo de trabajo basado en tareas, como la generación de imágenes o video:Errores comunes
| Problema | Solución |
|---|---|
| Usar un precio del modelo incorrecto | Copia el precio del mismo model ID en el directorio de modelos. |
| Ignorar los tokens de salida | Establece max_completion_tokens o el límite de salida específico del endpoint. |
| Tratar las estimaciones como facturas | Compara las estimaciones con el uso real después de la llamada. |
| Omitir multiplicadores de tareas | Para imagen, audio y video, verifica si la facturación es por tarea, por segundo o por recurso generado. |