Langsung ke konten utama
POST
/
kling
/
v1
/
videos
/
avatar
/
image2video
Create a Kling avatar task
curl --request POST \
  --url https://api.cometapi.com/kling/v1/videos/avatar/image2video \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "image": "example"
}
'
{
  "code": 123,
  "message": "<string>",
  "data": {
    "task_id": "<string>",
    "task_status": "<string>",
    "created_at": 123,
    "updated_at": 123,
    "task_info": {}
  }
}
Gunakan endpoint ini untuk membuat klip avatar berbicara dari satu gambar sumber dan satu sumber audio.

Sebelum Anda memanggilnya

  • Sediakan satu image avatar sebagai URL publik atau string base64 mentah
  • Kirim tepat satu dari audio_id atau sound_file
  • Buat request pertama tetap sederhana: satu gambar wajah, satu klip audio, dan prompt opsional yang singkat
  • Mulai dengan mode: std kecuali Anda memang membutuhkan jalur kualitas yang lebih tinggi

Aturan sumber audio

  • audio_id adalah cara termudah jika Anda sudah menghasilkan speech melalui rute Kling TTS
  • sound_file berfungsi jika Anda sudah memiliki aset MP3, WAV, M4A, atau AAC sendiri
  • Audio avatar didokumentasikan berdurasi 2 hingga 60 detik

Alur task

1

Buat task avatar

Kirim gambar dan satu sumber audio, lalu simpan id task yang dikembalikan.
2

Poll task

Lanjutkan dengan Individual Queries sampai task mencapai status terminal.
3

Simpan hasil akhir

Salin aset akhir ke penyimpanan Anda sendiri jika Anda memerlukan retensi di luar URL pengiriman dari penyedia.
Untuk referensi parameter lengkap, lihat dokumentasi resmi Kling Avatar.

Otorisasi

Authorization
string
header
wajib

Bearer token authentication. Use your CometAPI key.

Header

Content-Type
string

Optional content type header.

Body

application/json
image
string
default:example
wajib

Avatar reference image. Accepts an image URL or raw Base64 string (no data: prefix). Supported formats: JPG, JPEG, PNG. Max file size 10 MB. Minimum dimension 300 px on each side; aspect ratio between 1:2.5 and 2.5:1.

audio_id
string
wajib

Audio ID returned by the Kling TTS API. Only audio clips between 2 and 60 seconds generated within the last 30 days are accepted. Mutually exclusive with sound_file — exactly one must be provided.

sound_file
string

Audio file as a URL or Base64 string. Accepted formats: MP3, WAV, M4A, AAC. Max 5 MB, duration 2–60 seconds. Mutually exclusive with audio_id — exactly one must be provided.

prompt
string

Text prompt to guide avatar actions, emotions, and camera movements. Max 2500 characters.

mode
string

Generation mode. std (standard, faster and more cost-effective) or pro (professional, higher quality output).

callback_url
string

Webhook URL for task status notifications. The server sends a callback when the task status changes.

external_task_id
string

Optional user-defined task ID for your own tracking. Does not replace the system-generated task ID. Must be unique per account.

Respons

200 - application/json

Task accepted.

code
integer
wajib
message
string
wajib
data
object
wajib