Naar hoofdinhoud gaan
POST
/
v1
/
audio
/
translations
Python (OpenAI SDK)
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["COMETAPI_KEY"],
    base_url="https://api.cometapi.com/v1"
)

audio_file = open("audio.mp3", "rb")
translation = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)
print(translation.text)
{
  "text": "Hello, welcome to CometAPI."
}
Gebruik dit endpoint om gesproken audio naar Engelse tekst te vertalen. Het is geschikt voor meertalige supportwachtrijen, mediabeoordeling en workflows die één Engels transcript nodig hebben van audio in een andere taal.

Eerste request

Verstuur een ondersteund audiobestand met model en file. Gebruik eerst een kort voorbeeld, zodat je uploadverwerking, taaldetectie en het parseren van de output kunt verifiëren.

Lees de response

De standaardresponse bevat vertaalde Engelse text. Als je een ander responseformaat aanvraagt, parseer dan de response volgens dat formaat.

Volgende stappen

Autorisaties

Authorization
string
header
vereist

Bearer token authentication. Use your CometAPI key.

Body

multipart/form-data
file
file
vereist

The audio file to translate. Supported formats: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.

model
string
standaard:whisper-1
vereist

The audio translation model to use. Choose a current speech model from the Models page.

prompt
string

Optional text to guide the model's style or continue a previous audio segment. The prompt should be in English.

response_format
enum<string>
standaard:json

The output format for the translation.

Beschikbare opties:
json,
text,
srt,
verbose_json,
vtt
temperature
number
standaard:0

Sampling temperature between 0 and 1. Higher values produce more random output; lower values are more focused. When set to 0, the model auto-adjusts temperature using log probability.

Vereist bereik: 0 <= x <= 1

Respons

200 - application/json

The translation result in English.

text
string
vereist

The translated text in English.