الانتقال إلى المحتوى الرئيسي
POST
/
kling
/
v1
/
videos
/
avatar
/
image2video
Create a Kling avatar task
curl --request POST \
  --url https://api.cometapi.com/kling/v1/videos/avatar/image2video \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "image": "example"
}
'
{
  "code": 123,
  "message": "<string>",
  "data": {
    "task_id": "<string>",
    "task_status": "<string>",
    "created_at": 123,
    "updated_at": 123,
    "task_info": {}
  }
}
استخدم نقطة النهاية هذه لإنشاء مقاطع صورة رمزية ناطقة من صورة مصدر واحدة بالإضافة إلى مصدر صوت واحد.

قبل استدعائها

  • قدّم image واحدة للصورة الرمزية كرابط URL عام أو كسلسلة base64 خام
  • أرسل واحدًا فقط من audio_id أو sound_file
  • اجعل الطلب الأول بسيطًا: صورة وجه واحدة، ومقطع صوتي واحد، وPrompt اختياري قصير
  • ابدأ باستخدام mode: std ما لم تكن تحتاج تحديدًا إلى مسار الجودة الأعلى

قواعد مصدر الصوت

  • يُعد audio_id المسار الأسهل عندما تكون قد أنشأت الكلام بالفعل عبر مسار Kling TTS
  • يعمل sound_file عندما يكون لديك بالفعل ملف MP3 أو WAV أو M4A أو AAC خاص بك
  • تم توثيق مدة صوت الصورة الرمزية بأنها من 2 إلى 60 ثانية

تدفق المهمة

1

إنشاء مهمة الصورة الرمزية

أرسل الصورة ومصدر صوت واحد، ثم احفظ task id المُعاد.
2

استطلع المهمة

تابع باستخدام الاستعلامات الفردية حتى تصل المهمة إلى حالة نهائية.
3

خزّن النتيجة النهائية

انسخ الأصل النهائي إلى وحدة التخزين الخاصة بك إذا كنت بحاجة إلى الاحتفاظ به بعد انتهاء صلاحية عنوان URL الخاص بالتسليم من المزوّد.
للاطلاع على المرجع الكامل للمعلمات، راجع وثائق Kling Avatar الرسمية.

التفويضات

Authorization
string
header
مطلوب

Bearer token authentication. Use your CometAPI key.

الترويسات

Content-Type
string

Optional content type header.

الجسم

application/json
image
string
افتراضي:example
مطلوب

Avatar reference image. Accepts an image URL or raw Base64 string (no data: prefix). Supported formats: JPG, JPEG, PNG. Max file size 10 MB. Minimum dimension 300 px on each side; aspect ratio between 1:2.5 and 2.5:1.

audio_id
string
مطلوب

Audio ID returned by the Kling TTS API. Only audio clips between 2 and 60 seconds generated within the last 30 days are accepted. Mutually exclusive with sound_file — exactly one must be provided.

prompt
string
مطلوب

Text prompt to guide avatar actions, emotions, and camera movements. Max 2500 characters. Required — the API rejects requests without this field.

sound_file
string

Audio file as a URL or Base64 string. Accepted formats: MP3, WAV, M4A, AAC. Max 5 MB, duration 2–60 seconds. Mutually exclusive with audio_id — exactly one must be provided.

mode
string

Generation mode. std (standard, faster and more cost-effective) or pro (professional, higher quality output).

callback_url
string

Webhook URL for task status notifications. The server sends a callback when the task status changes.

external_task_id
string

Optional user-defined task ID for your own tracking. Does not replace the system-generated task ID. Must be unique per account.

الاستجابة

200 - application/json

Task accepted.

code
integer
مطلوب
message
string
مطلوب
data
object
مطلوب