Estimer kostnaden før et modellkall ved å kombinere prisen fra modellkatalogen med enhetene som endepunktet fakturerer etter: tokens, bilder, lydlengde eller videooppgaver. Behandle estimatet som en budsjettgrense, og bruk deretter faktisk bruk og faktureringsregistre etter at forespørselen er fullført.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
Estimer token-baserte kall
Følgende Python-eksempel estimerer kostnaden for en token-basert forespørsel ut fra konfigurerte prisverdier:Sett et maksimalt outputbudsjett
Følgende forespørsel begrenser generert output slik at estimatet får en øvre grense:Estimer oppgavebaserte kall
Følgende JavaScript-eksempel estimerer en oppgavebasert arbeidsflyt, for eksempel bilde- eller videogenerering:Vanlige feil
| Feil | Løsning |
|---|---|
| Bruker en pris fra feil modell | Kopier priser fra samme model ID i modellkatalogen. |
| Ignorerer output-tokens | Sett max_completion_tokens eller den endepunktspesifikke outputgrensen. |
| Behandler estimater som fakturaer | Sammenlign estimater med faktisk bruk etter kallet. |
| Manglende oppgavemultiplikatorer | For bilde, lyd og video, sjekk om fakturering skjer per oppgave, per sekund eller per generert ressurs. |