Passer au contenu principal
POST
/
kling
/
v1
/
videos
/
advanced-lip-sync
Create an advanced Kling lip-sync task
curl --request POST \
  --url https://api.cometapi.com/kling/v1/videos/advanced-lip-sync \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "session_id": "806556222048190514",
  "face_choose": [
    {
      "face_id": "0",
      "sound_file": "https://cdn1.suno.ai/e5c97078-3260-4354-a3a6-1d7249262a48.mp3",
      "sound_start_time": "1200",
      "sound_end_time": "5000",
      "sound_insert_time": "0"
    }
  ]
}
'
{
  "code": 123,
  "message": "<string>",
  "data": {
    "task_id": "<string>",
    "task_status": "<string>",
    "created_at": 123,
    "updated_at": 123
  }
}
Utilisez ce endpoint pour créer une tâche avancée de synchronisation labiale après avoir déjà identifié les visages dans la vidéo source.

Avant de l’appeler

  • Commencez par Lip-Sync pour obtenir le session_id et les valeurs face_id disponibles
  • Créez une ou plusieurs entrées face_choose qui associent chaque visage à un segment audio
  • Assurez-vous que les champs de timing décrivent comment l’audio doit s’aligner dans la vidéo

Flux de la tâche

1

Identifier d’abord les visages

Exécutez Lip-Sync sur la vidéo source et conservez le session_id renvoyé ainsi que les valeurs face_id cibles.
2

Créer la tâche avancée de synchronisation labiale

Soumettez session_id et le tableau face_choose via ce endpoint.
3

Suivre la tâche générée

Enregistrez l’identifiant de tâche renvoyé pour les vérifications de statut et la récupération du résultat final.
Pour la référence complète des paramètres, consultez la documentation officielle de Kling.

Autorisations

Authorization
string
header
requis

Bearer token authentication. Use your CometAPI key.

Corps

application/json
session_id
string
défaut:806556222048190514
requis

Session id returned by the face identification (lip-sync) endpoint.

face_choose
object[]
requis

Face-to-audio mappings. Each entry connects a detected face to an audio segment for lip-sync.

Réponse

200 - application/json

Task accepted.

code
integer
requis
message
string
requis
data
object
requis