Langsung ke konten utama
POST
/
v1
/
audio
/
speech
Python (OpenAI SDK)
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["COMETAPI_KEY"],
    base_url="https://api.cometapi.com/v1"
)

response = client.audio.speech.create(
    model="tts-1",
    voice="alloy",
    input="The quick brown fox jumped over the lazy dog."
)

response.stream_to_file("output.mp3")
"<string>"
Gunakan endpoint ini untuk mengubah teks menjadi file audio melalui audio API yang kompatibel dengan OpenAI. Endpoint ini cocok untuk narasi, prompt suara singkat, fitur baca nyaring, dan alur kerja lain ketika aplikasi Anda sudah memiliki teks dan memerlukan output suara.

Permintaan pertama

Mulailah dengan tiga field: model, input, dan voice. Buat permintaan pertama tetap singkat agar Anda dapat memverifikasi autentikasi, format audio, dan penanganan file sebelum menyesuaikan kecepatan atau format output.

Membaca respons

Respons berupa audio biner, bukan JSON. Dalam contoh SDK, tulis respons ke file seperti output.mp3. Dalam klien HTTP langsung, simpan body respons dan atur ekstensi file agar sesuai dengan response_format yang diminta.

Langkah berikutnya

Otorisasi

Authorization
string
header
wajib

Bearer token authentication. Use your CometAPI key.

Body

application/json
model
string
default:tts-1
wajib

The TTS model to use. Choose a current speech model from the Models page.

input
string
wajib

The text to generate audio for. Maximum length is 4096 characters.

Maximum string length: 4096
voice
enum<string>
default:alloy
wajib

The voice to use for speech synthesis.

Opsi yang tersedia:
alloy,
ash,
ballad,
coral,
echo,
fable,
onyx,
nova,
sage,
shimmer
response_format
enum<string>
default:mp3

The audio output format.

Opsi yang tersedia:
mp3,
opus,
aac,
flac,
wav,
pcm
speed
number
default:1

The speed of the generated audio. Select a value between 0.25 and 4.0.

Rentang yang diperlukan: 0.25 <= x <= 4

Respons

200 - audio/mpeg

The audio file content.

The response is of type file.