Saltar al contenido principal
POST
/
grok
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.cometapi.com/grok/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "prompt": "A candle flickers on a wooden table."
}
'
{
  "request_id": "4b2cd27e-0b0d-3dec-c31c-7572daf74bb3"
}
Usa este endpoint para iniciar un trabajo de video de Grok a partir de texto, o de texto más una imagen de origen. Devuelve un request_id de inmediato, así que trátalo como el primer paso de un flujo async.

Empieza con una solicitud pequeña

  • Usa model: grok-imagine-video
  • Para una prueba rápida, mantén duration en 1 y resolution en 480p
  • Añade image.url solo cuando quieras image-to-video
  • Si envías base64, mantén la forma de los documentos y del ejemplo OpenAPI como data:image/png;base64,<BASE64_IMAGE_DATA>

Flujo de la tarea

1

Crear el trabajo

Envía el prompt y guarda el request_id devuelto.
2

Consultar hasta completar

Llama a Get Video Generation Results hasta que el estado anidado del proveedor pase a ser done.
3

Persistir la salida

Copia la video.url final en tu propio almacenamiento si la necesitas después de la ventana de entrega temporal del proveedor.

Qué cambia en CometAPI

xAI documenta la generación de video como un flujo de dos pasos: iniciar -> consultar. CometAPI mantiene la misma forma de solicitud y el mismo id de modelo principal, pero te autenticas con tu clave de CometAPI y permaneces en la URL base de CometAPI. Una solicitud real de 1 segundo a 480p se completó correctamente el 2026-03-12 y devolvió una URL de resultado real.

Autorizaciones

Authorization
string
header
requerido

Bearer token authentication. Use your CometAPI key.

Cuerpo

application/json
prompt
string
requerido

Prompt for the video job.

Ejemplo:

"A candle flickers on a wooden table."

aspect_ratio
enum<string>

Output aspect ratio.

Opciones disponibles:
1:1,
16:9,
9:16,
4:3,
3:4,
3:2,
2:3
duration
integer
predeterminado:1

Output duration in seconds. xAI documents a range of 1 to 15 seconds.

image
object

Optional source image for image-to-video.

model
string
predeterminado:grok-imagine-video

xAI video model id.

Ejemplo:

"grok-imagine-video"

output
object
resolution
enum<string>

Output resolution.

Opciones disponibles:
480p,
720p
size
string

Deprecated size field. Prefer aspect_ratio and resolution.

user
string

Optional end-user identifier.

Respuesta

200 - application/json

Request accepted.

request_id
string
requerido

Deferred request id used for polling.