Audiomodellen
Create Speech
Gebruik CometAPI POST /v1/audio/speech om tekst om te zetten in levensechte audio met TTS-modellen. Kies uit 10 stemmen, pas de snelheid aan en geef uitvoer in MP3, OPUS, AAC, FLAC, WAV of PCM.
POST
Python (OpenAI SDK)
Gebruik dit endpoint om tekst om te zetten in een audiobestand via de OpenAI-compatibele audio-API. Het is geschikt voor vertelling, korte spraakprompts, voorleesfuncties en andere workflows waarbij je app al tekst heeft en spraakuitvoer nodig heeft.
Eerste request
Begin met drie velden:model, input en voice. Houd het eerste request kort zodat je authenticatie, audioformaat en bestandsafhandeling kunt verifiëren voordat je de snelheid of het uitvoerformaat afstemt.
Lees de response
De response is binaire audio, geen JSON. Schrijf in SDK-voorbeelden de response naar een bestand zoalsoutput.mp3. Sla in directe HTTP-clients de response body op en stel de bestandsextensie in zodat die overeenkomt met het aangevraagde response_format.
Volgende stappen
- Gebruik Create Transcription wanneer je spraak weer in tekst moet omzetten.
- Gebruik Create Translation wanneer je Engelstalige tekst nodig hebt uit niet-Engelstalige audio.
Autorisaties
Bearer token authentication. Use your CometAPI key.
Body
application/json
The TTS model to use. Choose a current speech model from the Models page.
The text to generate audio for. Maximum length is 4096 characters.
Maximum string length:
4096The voice to use for speech synthesis.
Beschikbare opties:
alloy, ash, ballad, coral, echo, fable, onyx, nova, sage, shimmer The audio output format.
Beschikbare opties:
mp3, opus, aac, flac, wav, pcm The speed of the generated audio. Select a value between 0.25 and 4.0.
Vereist bereik:
0.25 <= x <= 4Respons
200 - audio/mpeg
The audio file content.
The response is of type file.