Schat de kosten vóór een modelaanroep door de prijs uit de modeldirectory te combineren met de eenheden waarop het endpoint factureert: tokens, afbeeldingen, audiolengte of videotaken. Behandel de schatting als een budgetbewaking en gebruik daarna de werkelijke usage- en facturatierecords zodra de aanvraag is voltooid.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
Schat tokengebaseerde aanroepen
Het volgende Python-voorbeeld schat de kosten van een tokengebaseerde aanvraag op basis van geconfigureerde prijswaarden:Stel een maximaal outputbudget in
De volgende aanvraag begrenst de gegenereerde output zodat de schatting een bovengrens heeft:Schat taakgebaseerde aanroepen
Het volgende JavaScript-voorbeeld schat een taakgebaseerde workflow, zoals het genereren van afbeeldingen of video:Veelvoorkomende fouten
| Fout | Oplossing |
|---|---|
| Een prijs van het verkeerde model gebruiken | Kopieer de prijsinformatie van hetzelfde model ID uit de modeldirectory. |
| Output tokens negeren | Stel max_completion_tokens of de endpointspecifieke outputlimiet in. |
| Schattingen behandelen als facturen | Vergelijk schattingen met de werkelijke usage na de aanroep. |
| Taakvermenigvuldigers ontbreken | Controleer voor afbeeldingen, audio en video of de facturatie per taak, per seconde of per gegenereerde asset is. |