Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
Обрабатывайте rate limits, контролируя concurrency до того, как запросы покинут ваше приложение. Когда CometAPI возвращает 429, повторите запрос с exponential backoff и jitter, а затем уменьшите всплески трафика, если повторные попытки происходят снова.
Ограничение concurrency
Следующий пример на Python ограничивает количество одновременных chat-запросов с помощью асинхронного семафора:
import asyncio
import os
from openai import AsyncOpenAI
client = AsyncOpenAI(
api_key=os.environ["COMETAPI_KEY"],
base_url="https://api.cometapi.com/v1",
)
semaphore = asyncio.Semaphore(5)
async def ask(prompt):
async with semaphore:
completion = await client.chat.completions.create(
model="your-model-id",
messages=[{"role": "user", "content": prompt}],
)
return completion.choices[0].message.content
async def main():
prompts = ["Say hello.", "Write a title.", "Return one JSON key."]
results = await asyncio.gather(*(ask(prompt) for prompt in prompts))
print(results)
asyncio.run(main())
Результат представляет собой массив выходных данных модели:
[
"Hello.",
"A concise title",
"{\"key\":\"value\"}"
]
Повтор rate limits
Следующий пример на JavaScript повторяет ответы 429 с jitter:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.COMETAPI_KEY,
baseURL: "https://api.cometapi.com/v1",
});
async function sleep(milliseconds) {
return new Promise((resolve) => setTimeout(resolve, milliseconds));
}
async function createCompletion() {
for (let attempt = 0; attempt < 5; attempt += 1) {
try {
return await client.chat.completions.create({
model: "your-model-id",
messages: [{ role: "user", content: "Say hello." }],
});
} catch (error) {
if (error.status !== 429 || attempt === 4) {
throw error;
}
const delay = Math.min(30000, 1000 * 2 ** attempt);
await sleep(delay + Math.random() * 1000);
}
}
}
const completion = await createCompletion();
console.log(completion.choices[0].message.content);
Успешный ответ содержит обычный chat completion:
{
"choices": [
{
"message": {
"content": "Hello."
}
}
]
}
Распространенные ошибки
| Ошибка | Исправление |
|---|
| Неограниченные параллельные запросы | Добавьте семафор, очередь или пул worker-ов. |
| Повтор всех сбоев | Повторяйте только 429 и временные сбои сервера. |
| Нет метрик по каждой модели | Логируйте route, model ID, status и latency для каждого запроса. |
| Шторм повторных попыток | Добавьте jitter и ограничьте максимальную задержку повтора. |
Связанные ссылки