아바타
CometAPI의 Kling Avatar API를 사용해 이미지에서 아바타 기반 영상을 생성합니다. 빠른 이미지-투-비디오 아바타 생성을 위해 POST /kling/v1/videos/avatar/image2video를 사용하세요.
이 엔드포인트를 사용하면 하나의 원본 이미지와 하나의 오디오 소스를 기반으로 말하는 아바타 클립을 만들 수 있습니다.Documentation Index
Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt
Use this file to discover all available pages before exploring further.
호출 전에 확인하세요
- 하나의 아바타
image를 공개 URL 또는 원시 base64 문자열로 제공하세요 audio_id또는sound_file중 정확히 하나만 전송하세요- 첫 번째 요청은 단순하게 유지하세요: 얼굴 이미지 1개, 오디오 클립 1개, 그리고 선택 사항인 짧은 프롬프트
- 특별히 더 높은 품질의 경로가 필요하지 않다면
mode: std로 시작하세요
오디오 소스 규칙
audio_id는 이미 Kling TTS 경로를 통해 음성을 생성한 경우 가장 쉬운 방법입니다sound_file는 이미 자체 MP3, WAV, M4A 또는 AAC 리소스를 가지고 있을 때 사용할 수 있습니다- 아바타 오디오는 길이가 2초에서 60초로 문서화되어 있습니다
작업 흐름
작업 폴링
인증
Bearer token authentication. Use your CometAPI key.
헤더
Optional content type header.
본문
- Option 1
- Option 2
Avatar reference image. Accepts an image URL or raw Base64 string (no data: prefix). Supported formats: JPG, JPEG, PNG. Max file size 10 MB. Minimum dimension 300 px on each side; aspect ratio between 1:2.5 and 2.5:1.
Audio ID returned by the Kling TTS API. Only audio clips between 2 and 60 seconds generated within the last 30 days are accepted. Mutually exclusive with sound_file — exactly one must be provided.
Text prompt to guide avatar actions, emotions, and camera movements. Max 2500 characters. Required — the API rejects requests without this field.
Audio file as a URL or Base64 string. Accepted formats: MP3, WAV, M4A, AAC. Max 5 MB, duration 2–60 seconds. Mutually exclusive with audio_id — exactly one must be provided.
Generation mode. std (standard, faster and more cost-effective) or pro (professional, higher quality output).
Webhook URL for task status notifications. The server sends a callback when the task status changes.
Optional user-defined task ID for your own tracking. Does not replace the system-generated task ID. Must be unique per account.