الصورة الرمزية
أنشئ مقاطع فيديو مدفوعة بالصورة الرمزية من الصور باستخدام Kling Avatar API في CometAPI. استخدم POST /kling/v1/videos/avatar/image2video للحصول على صور رمزية سريعة من image-to-video.
قبل استدعائها
- قدّم
imageواحدة للصورة الرمزية كرابط URL عام أو كسلسلة base64 خام - أرسل واحدًا فقط من
audio_idأوsound_file - اجعل الطلب الأول بسيطًا: صورة وجه واحدة، ومقطع صوتي واحد، وPrompt اختياري قصير
- ابدأ باستخدام
mode: stdما لم تكن تحتاج تحديدًا إلى مسار الجودة الأعلى
قواعد مصدر الصوت
- يُعد
audio_idالمسار الأسهل عندما تكون قد أنشأت الكلام بالفعل عبر مسار Kling TTS - يعمل
sound_fileعندما يكون لديك بالفعل ملف MP3 أو WAV أو M4A أو AAC خاص بك - تم توثيق مدة صوت الصورة الرمزية بأنها من 2 إلى 60 ثانية
تدفق المهمة
استطلع المهمة
التفويضات
Bearer token authentication. Use your CometAPI key.
الترويسات
Optional content type header.
الجسم
- Option 1
- Option 2
Avatar reference image. Accepts an image URL or raw Base64 string (no data: prefix). Supported formats: JPG, JPEG, PNG. Max file size 10 MB. Minimum dimension 300 px on each side; aspect ratio between 1:2.5 and 2.5:1.
Audio ID returned by the Kling TTS API. Only audio clips between 2 and 60 seconds generated within the last 30 days are accepted. Mutually exclusive with sound_file — exactly one must be provided.
Text prompt to guide avatar actions, emotions, and camera movements. Max 2500 characters. Required — the API rejects requests without this field.
Audio file as a URL or Base64 string. Accepted formats: MP3, WAV, M4A, AAC. Max 5 MB, duration 2–60 seconds. Mutually exclusive with audio_id — exactly one must be provided.
Generation mode. std (standard, faster and more cost-effective) or pro (professional, higher quality output).
Webhook URL for task status notifications. The server sends a callback when the task status changes.
Optional user-defined task ID for your own tracking. Does not replace the system-generated task ID. Must be unique per account.