- Tạo ảnh từ văn bản
- Chỉnh sửa ảnh từ ảnh
- Ghép nhiều hình ảnh
- Lưu hình ảnh được tạo
- Base URL:
https://api.cometapi.com - Cài đặt SDK:
pip install google-genai(Python) hoặcnpm install @google/genai(Node.js)
Thiết lập
Khởi tạo client với base URL của CometAPI:Tạo ảnh từ văn bản
Tạo một hình ảnh từ prompt văn bản và lưu nó vào một tệp.candidates[0].content.parts, có thể chứa các phần văn bản và/hoặc hình ảnh:
Tạo ảnh từ ảnh
Tải lên một ảnh đầu vào và biến đổi nó bằng một prompt văn bản.- SDK Python chấp nhận trực tiếp các đối tượng
PIL.Image— không cần mã hóa Base64 thủ công. - Không thêm tiền tố
data:image/jpeg;base64,khi truyền chuỗi Base64 thô.
Ghép nhiều ảnh
Tạo một ảnh mới từ nhiều ảnh đầu vào. CometAPI hỗ trợ hai cách tiếp cận:Phương pháp 1: Một ảnh ghép duy nhất
Kết hợp nhiều ảnh nguồn thành một ảnh ghép, sau đó mô tả đầu ra mong muốn.

Phương pháp 2: Nhiều ảnh riêng biệt (tối đa 14)
Truyền trực tiếp nhiều ảnh. Các model Gemini 3 hỗ trợ tối đa 14 ảnh tham chiếu (đối tượng + nhân vật):
Tạo ảnh 4K
Chỉ địnhimage_config với aspect_ratio và image_size để xuất ra độ phân giải cao:
Chỉnh sửa ảnh nhiều lượt (chat)
Sử dụng tính năng chat của SDK để tinh chỉnh ảnh theo từng bước lặp:Mẹo
Tối ưu Prompt
Tối ưu Prompt
Chỉ định các từ khóa về phong cách (ví dụ: “cyberpunk, film grain, low contrast”), tỷ lệ khung hình, chủ thể, nền, ánh sáng và mức độ chi tiết.
Định dạng Base64
Định dạng Base64
Khi sử dụng HTTP thô, không bao gồm tiền tố
data:image/png;base64, — chỉ dùng chuỗi Base64 thô. Python SDK tự động xử lý việc này với các đối tượng PIL.Image.Buộc xuất hình ảnh
Buộc xuất hình ảnh
Đặt
"responseModalities" thành ["IMAGE"] để đảm bảo đầu ra là hình ảnh mà không có văn bản.