メインコンテンツへスキップ
POST
/
v1
/
audio
/
translations
Python (OpenAI SDK)
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["COMETAPI_KEY"],
    base_url="https://api.cometapi.com/v1"
)

audio_file = open("audio.mp3", "rb")
translation = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)
print(translation.text)
{
  "text": "Hello, welcome to CometAPI."
}
このエンドポイントを使用して、音声を英語テキストに翻訳します。多言語対応のサポートキュー、メディアレビュー、そして別の言語の音声から 1 つの英語の文字起こしが必要なワークフローに適しています。

最初のリクエスト

modelfile を指定して、対応している音声ファイルを送信します。まずは短いサンプルを使って、アップロード処理、言語検出、出力の解析を確認してください。

レスポンスを読む

デフォルトのレスポンスには、翻訳された英語の text が含まれます。別のレスポンス形式を要求した場合は、その形式に従ってレスポンスを解析してください。

次のステップ

  • 元の言語のテキストが必要な場合は、Create Transcription を使用します。
  • テキストから音声を生成する必要がある場合は、Create Speech を使用します。

承認

Authorization
string
header
必須

Bearer token authentication. Use your CometAPI key.

ボディ

multipart/form-data
file
file
必須

The audio file to translate. Supported formats: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.

model
string
デフォルト:whisper-1
必須

The audio translation model to use. Choose a current speech model from the Models page.

prompt
string

Optional text to guide the model's style or continue a previous audio segment. The prompt should be in English.

response_format
enum<string>
デフォルト:json

The output format for the translation.

利用可能なオプション:
json,
text,
srt,
verbose_json,
vtt
temperature
number
デフォルト:0

Sampling temperature between 0 and 1. Higher values produce more random output; lower values are more focused. When set to 0, the model auto-adjusts temperature using log probability.

必須範囲: 0 <= x <= 1

レスポンス

200 - application/json

The translation result in English.

text
string
必須

The translated text in English.