Naar hoofdinhoud gaan
POST
/
v1
/
audio
/
speech
Python (OpenAI SDK)
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["COMETAPI_KEY"],
    base_url="https://api.cometapi.com/v1"
)

response = client.audio.speech.create(
    model="tts-1",
    voice="alloy",
    input="The quick brown fox jumped over the lazy dog."
)

response.stream_to_file("output.mp3")
"<string>"
Gebruik dit endpoint om tekst om te zetten in een audiobestand via de OpenAI-compatibele audio-API. Het is geschikt voor vertelling, korte spraakprompts, voorleesfuncties en andere workflows waarbij je app al tekst heeft en spraakuitvoer nodig heeft.

Eerste request

Begin met drie velden: model, input en voice. Houd het eerste request kort zodat je authenticatie, audioformaat en bestandsafhandeling kunt verifiëren voordat je de snelheid of het uitvoerformaat afstemt.

Lees de response

De response is binaire audio, geen JSON. Schrijf in SDK-voorbeelden de response naar een bestand zoals output.mp3. Sla in directe HTTP-clients de response body op en stel de bestandsextensie in zodat die overeenkomt met het aangevraagde response_format.

Volgende stappen

Autorisaties

Authorization
string
header
vereist

Bearer token authentication. Use your CometAPI key.

Body

application/json
model
string
standaard:tts-1
vereist

The TTS model to use. Choose a current speech model from the Models page.

input
string
vereist

The text to generate audio for. Maximum length is 4096 characters.

Maximum string length: 4096
voice
enum<string>
standaard:alloy
vereist

The voice to use for speech synthesis.

Beschikbare opties:
alloy,
ash,
ballad,
coral,
echo,
fable,
onyx,
nova,
sage,
shimmer
response_format
enum<string>
standaard:mp3

The audio output format.

Beschikbare opties:
mp3,
opus,
aac,
flac,
wav,
pcm
speed
number
standaard:1

The speed of the generated audio. Select a value between 0.25 and 4.0.

Vereist bereik: 0.25 <= x <= 4

Respons

200 - audio/mpeg

The audio file content.

The response is of type file.