音声モデル
音声生成
CometAPI の POST /v1/audio/speech を使用して、テキストを TTS モデルで自然な音声に変換します。10 種類の音声から選択し、速度を調整して、MP3、OPUS、AAC、FLAC、WAV、または PCM で出力できます。
POST
Python (OpenAI SDK)
Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
承認
Bearer token authentication. Use your CometAPI key.
ボディ
application/json
The TTS model to use. Choose a current speech model from the Models page.
The text to generate audio for. Maximum length is 4096 characters.
Maximum string length:
4096The voice to use for speech synthesis.
利用可能なオプション:
alloy, ash, ballad, coral, echo, fable, onyx, nova, sage, shimmer The audio output format.
利用可能なオプション:
mp3, opus, aac, flac, wav, pcm The speed of the generated audio. Select a value between 0.25 and 4.0.
必須範囲:
0.25 <= x <= 4レスポンス
200 - audio/mpeg
The audio file content.
The response is of type file.