Model Audio
Create Speech
Gunakan CometAPI POST /v1/audio/speech untuk mengubah teks menjadi audio yang terdengar alami dengan model TTS. Pilih dari 10 suara, sesuaikan kecepatan, dan hasilkan output dalam MP3, OPUS, AAC, FLAC, WAV, atau PCM.
POST
Python (OpenAI SDK)
Gunakan endpoint ini untuk mengubah teks menjadi file audio melalui audio API yang kompatibel dengan OpenAI. Endpoint ini cocok untuk narasi, prompt suara singkat, fitur baca nyaring, dan alur kerja lain ketika aplikasi Anda sudah memiliki teks dan memerlukan output suara.
Permintaan pertama
Mulailah dengan tiga field:model, input, dan voice. Buat permintaan pertama tetap singkat agar Anda dapat memverifikasi autentikasi, format audio, dan penanganan file sebelum menyesuaikan kecepatan atau format output.
Membaca respons
Respons berupa audio biner, bukan JSON. Dalam contoh SDK, tulis respons ke file sepertioutput.mp3. Dalam klien HTTP langsung, simpan body respons dan atur ekstensi file agar sesuai dengan response_format yang diminta.
Langkah berikutnya
- Gunakan Create Transcription saat Anda perlu mengubah ucapan kembali menjadi teks.
- Gunakan Create Translation saat Anda memerlukan teks bahasa Inggris dari audio non-Inggris.
Otorisasi
Bearer token authentication. Use your CometAPI key.
Body
application/json
The TTS model to use. Choose a current speech model from the Models page.
The text to generate audio for. Maximum length is 4096 characters.
Maximum string length:
4096The voice to use for speech synthesis.
Opsi yang tersedia:
alloy, ash, ballad, coral, echo, fable, onyx, nova, sage, shimmer The audio output format.
Opsi yang tersedia:
mp3, opus, aac, flac, wav, pcm The speed of the generated audio. Select a value between 0.25 and 4.0.
Rentang yang diperlukan:
0.25 <= x <= 4Respons
200 - audio/mpeg
The audio file content.
The response is of type file.