Zum Hauptinhalt springen
POST
/
kling
/
v1
/
videos
/
avatar
/
image2video
Create a Kling avatar task
curl --request POST \
  --url https://api.cometapi.com/kling/v1/videos/avatar/image2video \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "image": "example"
}
'
{
  "code": 123,
  "message": "<string>",
  "data": {
    "task_id": "<string>",
    "task_status": "<string>",
    "created_at": 123,
    "updated_at": 123,
    "task_info": {}
  }
}
Verwenden Sie diesen Endpoint, um sprechende Avatar-Clips aus einem Quellbild und einer Audioquelle zu erstellen.

Bevor Sie ihn aufrufen

  • Stellen Sie ein Avatar-image als öffentliche URL oder als rohen base64-String bereit
  • Senden Sie genau eines von audio_id oder sound_file
  • Halten Sie die erste Anfrage einfach: ein Gesichtsbild, ein Audioclip und ein kurzer optionaler Prompt
  • Beginnen Sie mit mode: std, es sei denn, Sie benötigen ausdrücklich den höherwertigen Pfad

Regeln für die Audioquelle

  • audio_id ist der einfachste Weg, wenn Sie Sprache bereits über die Kling-TTS-Route erzeugt haben
  • sound_file funktioniert, wenn Sie bereits Ihre eigene MP3-, WAV-, M4A- oder AAC-Datei haben
  • Avatar-Audio ist laut Dokumentation 2 bis 60 Sekunden lang

Aufgabenablauf

1

Avatar-Aufgabe erstellen

Senden Sie das Bild und eine Audioquelle und speichern Sie dann die zurückgegebene task id.
2

Aufgabe abfragen

Fahren Sie mit Einzelabfragen fort, bis die Aufgabe einen Endzustand erreicht.
3

Fertiges Ergebnis speichern

Kopieren Sie das finale Asset in Ihren eigenen Speicher, wenn Sie es über die URL zur Bereitstellung des Anbieters hinaus aufbewahren müssen.
Die vollständige Parameterreferenz finden Sie in der offiziellen Kling Avatar-Dokumentation.

Autorisierungen

Authorization
string
header
erforderlich

Bearer token authentication. Use your CometAPI key.

Header

Content-Type
string

Optional content type header.

Body

application/json
image
string
Standard:example
erforderlich

Avatar reference image. Accepts an image URL or raw Base64 string (no data: prefix). Supported formats: JPG, JPEG, PNG. Max file size 10 MB. Minimum dimension 300 px on each side; aspect ratio between 1:2.5 and 2.5:1.

audio_id
string
erforderlich

Audio ID returned by the Kling TTS API. Only audio clips between 2 and 60 seconds generated within the last 30 days are accepted. Mutually exclusive with sound_file — exactly one must be provided.

sound_file
string

Audio file as a URL or Base64 string. Accepted formats: MP3, WAV, M4A, AAC. Max 5 MB, duration 2–60 seconds. Mutually exclusive with audio_id — exactly one must be provided.

prompt
string

Text prompt to guide avatar actions, emotions, and camera movements. Max 2500 characters.

mode
string

Generation mode. std (standard, faster and more cost-effective) or pro (professional, higher quality output).

callback_url
string

Webhook URL for task status notifications. The server sends a callback when the task status changes.

external_task_id
string

Optional user-defined task ID for your own tracking. Does not replace the system-generated task ID. Must be unique per account.

Antwort

200 - application/json

Task accepted.

code
integer
erforderlich
message
string
erforderlich
data
object
erforderlich