Schätzen Sie die Kosten vor einem Modellaufruf, indem Sie den Preis aus dem Modellverzeichnis mit den Einheiten kombinieren, die der Endpoint abrechnet: Tokens, Bilder, Audiolänge oder Video-Tasks. Behandeln Sie die Schätzung als Budgetschutz und verwenden Sie nach Abschluss der Anfrage die tatsächlichen Nutzungs- und Abrechnungsdaten.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
Token-basierte Aufrufe schätzen
Das folgende Python-Beispiel schätzt die Kosten einer token-basierten Anfrage anhand konfigurierter Preiswerte:Ein maximales Ausgabebudget festlegen
Die folgende Anfrage begrenzt die generierte Ausgabe, damit die Schätzung eine Obergrenze hat:Task-basierte Aufrufe schätzen
Das folgende JavaScript-Beispiel schätzt einen task-basierten Workflow wie Bild- oder Videogenerierung:Häufige Fehler
| Fehler | Lösung |
|---|---|
| Verwendung eines Preises vom falschen Modell | Übernehmen Sie die Preise aus dem Modellverzeichnis desselben model ID. |
| Ausgabe-Tokens ignorieren | Legen Sie max_completion_tokens oder das endpoint-spezifische Ausgabelimit fest. |
| Schätzungen als Rechnungen behandeln | Vergleichen Sie Schätzungen nach dem Aufruf mit der tatsächlichen usage. |
| Fehlende Task-Multiplikatoren | Prüfen Sie bei Bild, Audio und Video, ob pro Task, pro Sekunde oder pro generiertem Asset abgerechnet wird. |