Перейти к основному содержанию
POST
/
kling
/
v1
/
videos
/
avatar
/
image2video
Create a Kling avatar task
curl --request POST \
  --url https://api.cometapi.com/kling/v1/videos/avatar/image2video \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "image": "example"
}
'
{
  "code": 123,
  "message": "<string>",
  "data": {
    "task_id": "<string>",
    "task_status": "<string>",
    "created_at": 123,
    "updated_at": 123,
    "task_info": {}
  }
}

Documentation Index

Fetch the complete documentation index at: https://apidoc.cometapi.com/llms.txt

Use this file to discover all available pages before exploring further.

Используйте этот endpoint, чтобы создавать клипы с говорящим аватаром из одного исходного изображения и одного источника аудио.

Перед вызовом

  • Укажите одно image аватара как публичный URL или строку base64
  • Передайте ровно одно из audio_id или sound_file
  • Для первого запроса используйте простую конфигурацию: одно изображение лица, один аудиоклип и короткий необязательный Prompt
  • Начинайте с mode: std, если вам специально не нужен путь с более высоким качеством

Правила для источника аудио

  • audio_id — самый простой вариант, если вы уже сгенерировали речь через маршрут Kling TTS
  • sound_file подходит, если у вас уже есть собственный ресурс в формате MP3, WAV, M4A или AAC
  • Для аудио аватара указана длительность от 2 до 60 секунд

Поток задач

1

Create the avatar task

Отправьте изображение и один источник аудио, затем сохраните возвращённый id задачи.
2

Poll the task

Продолжайте с Individual Queries, пока задача не достигнет терминального состояния.
3

Store the finished result

Скопируйте итоговый ресурс в собственное хранилище, если вам нужно хранение дольше, чем позволяет URL доставки от провайдера.
Полное описание параметров см. в официальной документации Kling Avatar.

Авторизации

Authorization
string
header
обязательно

Bearer token authentication. Use your CometAPI key.

Заголовки

Content-Type
string

Optional content type header.

Тело

application/json
image
string
по умолчанию:example
обязательно

Avatar reference image. Accepts an image URL or raw Base64 string (no data: prefix). Supported formats: JPG, JPEG, PNG. Max file size 10 MB. Minimum dimension 300 px on each side; aspect ratio between 1:2.5 and 2.5:1.

audio_id
string
обязательно

Audio ID returned by the Kling TTS API. Only audio clips between 2 and 60 seconds generated within the last 30 days are accepted. Mutually exclusive with sound_file — exactly one must be provided.

prompt
string
обязательно

Text prompt to guide avatar actions, emotions, and camera movements. Max 2500 characters. Required — the API rejects requests without this field.

sound_file
string

Audio file as a URL or Base64 string. Accepted formats: MP3, WAV, M4A, AAC. Max 5 MB, duration 2–60 seconds. Mutually exclusive with audio_id — exactly one must be provided.

mode
string

Generation mode. std (standard, faster and more cost-effective) or pro (professional, higher quality output).

callback_url
string

Webhook URL for task status notifications. The server sends a callback when the task status changes.

external_task_id
string

Optional user-defined task ID for your own tracking. Does not replace the system-generated task ID. Must be unique per account.

Ответ

200 - application/json

Task accepted.

code
integer
обязательно
message
string
обязательно
data
object
обязательно