Stimare il costo di una richiesta prima di chiamare un modello

Stima il costo prima di una chiamata al modello combinando il prezzo della directory dei modelli con le unità fatturate dall’endpoint: token, immagini, durata audio o task video. Considera la stima come una protezione di budget, quindi usa i dati di utilizzo reali e i record di fatturazione dopo il completamento della richiesta.

Stimare chiamate basate su token

L’esempio Python seguente stima il costo di una richiesta basata su token a partire dai valori di prezzo configurati:

import math
import os

prompt = "Write a short product description for CometAPI."
max_output_tokens = 200

input_price_per_1m = float(os.environ["MODEL_INPUT_PRICE_PER_1M"])
output_price_per_1m = float(os.environ["MODEL_OUTPUT_PRICE_PER_1M"])

estimated_input_tokens = math.ceil(len(prompt) / 4)

estimated_cost = (
    estimated_input_tokens * input_price_per_1m
    + max_output_tokens * output_price_per_1m
) / 1_000_000

print(f"Estimated maximum cost: ${estimated_cost:.6f}")

Il risultato è una stima pre-chiamata:

Estimated maximum cost: $0.000123

Impostare un budget massimo di output

La richiesta seguente limita l’output generato in modo che la stima abbia un limite superiore:

curl https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "your-model-id",
    "messages": [
      {
        "role": "user",
        "content": "Write a short product description for CometAPI."
      }
    ],
    "max_completion_tokens": 200
  }'

La risposta include l’utilizzo effettivo dopo la chiamata al modello:

{
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 42,
    "total_tokens": 52
  }
}

Stimare chiamate basate su task

L’esempio JavaScript seguente stima un flusso di lavoro basato su task, come la generazione di immagini o video:

const taskCount = 3;
const pricePerTask = Number(process.env.MODEL_PRICE_PER_TASK);

const estimatedCost = taskCount * pricePerTask;

console.log(`Estimated maximum cost: $${estimatedCost.toFixed(4)}`);

Il risultato è il budget del task:

Estimated maximum cost: $0.4500

Errori comuni

Errore	Correzione
Usare un prezzo del modello sbagliato	Copia i prezzi dallo stesso model ID nella directory dei modelli.
Ignorare i token di output	Imposta `max_completion_tokens` o il limite di output specifico dell’endpoint.
Trattare le stime come fatture	Confronta le stime con l’utilizzo effettivo dopo la chiamata.
Moltiplicatori di task mancanti	Per immagini, audio e video, verifica se la fatturazione è per task, per secondo o per asset generato.

Inizia qui

Guide rapide alle API dei modelli

Guide principali API

Librerie

Errori

Prezzi e fatturazione

Supporto

Stimare il costo di una richiesta prima di chiamare un modello

Stimare chiamate basate su token

Impostare un budget massimo di output

Stimare chiamate basate su task

Errori comuni

Link correlati

​Stimare chiamate basate su token

​Impostare un budget massimo di output

​Stimare chiamate basate su task

​Errori comuni

​Link correlati

Stimare chiamate basate su token

Impostare un budget massimo di output

Stimare chiamate basate su task

Errori comuni

Link correlati