Oszacuj koszt przed wywołaniem modelu, łącząc cenę z katalogu modeli z jednostkami, według których endpoint nalicza opłaty: tokens, obrazy, długość audio lub zadania wideo. Traktuj oszacowanie jako zabezpieczenie budżetu, a po zakończeniu żądania korzystaj z rzeczywistego użycia i rekordów rozliczeniowych.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
Oszacowanie wywołań opartych na tokenach
Poniższy przykład w Pythonie szacuje koszt żądania opartego na tokenach na podstawie skonfigurowanych wartości cenowych:Ustaw maksymalny budżet danych wyjściowych
Poniższe żądanie ogranicza generowane dane wyjściowe, aby oszacowanie miało górną granicę:Oszacowanie wywołań opartych na zadaniach
Poniższy przykład w JavaScript szacuje przepływ pracy oparty na zadaniach, taki jak generowanie obrazów lub wideo:Częste błędy
| Błąd | Rozwiązanie |
|---|---|
| Użycie ceny z niewłaściwego modelu | Skopiuj ceny z tego samego model ID w katalogu modeli. |
| Ignorowanie tokenów wyjściowych | Ustaw max_completion_tokens lub limit danych wyjściowych właściwy dla danego endpointu. |
| Traktowanie oszacowań jak faktur | Porównuj oszacowania z rzeczywistym użyciem po wywołaniu. |
| Brak mnożników zadań | W przypadku obrazów, audio i wideo sprawdź, czy rozliczenie jest naliczane za zadanie, za sekundę czy za wygenerowany zasób. |