Estime o custo antes de uma chamada de model combinando o preço do diretório de models com as unidades cobradas pelo endpoint: tokens, imagens, duração de áudio ou tarefas de vídeo. Trate a estimativa como uma proteção de orçamento e, depois que a requisição for concluída, use o uso real e os registros de cobrança.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
Estimar chamadas baseadas em tokens
O exemplo em Python a seguir estima o custo de uma requisição baseada em tokens a partir dos valores de preço configurados:Definir um orçamento máximo de saída
A requisição a seguir limita a saída gerada para que a estimativa tenha um limite superior:Estimar chamadas baseadas em tarefas
O exemplo em JavaScript a seguir estima um fluxo de trabalho baseado em tarefas, como geração de imagem ou vídeo:Erros comuns
| Erro | Correção |
|---|---|
| Usar um preço do model errado | Copie o preço do mesmo model ID no diretório de models. |
| Ignorar tokens de saída | Defina max_completion_tokens ou o limite de saída específico do endpoint. |
| Tratar estimativas como faturas | Compare as estimativas com o uso real após a chamada. |
| Multiplicadores de tarefa ausentes | Para imagem, áudio e vídeo, verifique se a cobrança é por tarefa, por segundo ou por ativo gerado. |