번역 생성
CometAPI POST /v1/audio/translations를 사용하여 음성 오디오를 영어 텍스트로 번역합니다. 여러 출력 형식을 지원하는 Whisper model을 지원합니다.
첫 요청
지원되는 오디오 파일과model, file을 전송합니다. 먼저 짧은 샘플을 사용하면 업로드 처리, 언어 감지, 출력 파싱을 확인할 수 있습니다.
응답 읽기
기본 응답에는 번역된 영어text가 포함됩니다. 다른 응답 형식을 요청한 경우 해당 형식에 따라 응답을 파싱하세요.
다음 단계
- 원본 언어의 텍스트가 필요할 때는 Create Transcription을 사용하세요.
- 텍스트에서 오디오를 생성해야 할 때는 Create Speech을 사용하세요.
인증
Bearer token authentication. Use your CometAPI key.
본문
The audio file to translate. Supported formats: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
The audio translation model to use. Choose a current speech model from the Models page.
Optional text to guide the model's style or continue a previous audio segment. The prompt should be in English.
The output format for the translation.
json, text, srt, verbose_json, vtt Sampling temperature between 0 and 1. Higher values produce more random output; lower values are more focused. When set to 0, the model auto-adjusts temperature using log probability.
0 <= x <= 1응답
The translation result in English.
The translated text in English.