- テキストから画像の生成
- 画像から画像への編集
- 複数画像の合成
- 生成した画像の保存
- Base URL:
https://api.cometapi.com - SDK をインストール:
pip install google-genai(Python)またはnpm install @google/genai(Node.js)
セットアップ
CometAPI の base URL を指定してクライアントを初期化します。テキストから画像を生成
テキストプロンプトから画像を生成し、ファイルに保存します。candidates[0].content.parts にあり、ここにはテキストパートや画像パートが含まれる場合があります。
画像から画像への生成
入力画像をアップロードし、テキストプロンプトで変換します。- Python SDK は
PIL.Imageオブジェクトを直接受け付けるため、手動での Base64 エンコードは不要です。 - 生の Base64 文字列を渡す際は、
data:image/jpeg;base64,プレフィックスを 含めないで ください。
マルチ画像合成
複数の入力画像から新しい画像を生成します。CometAPI は 2 つのアプローチをサポートしています。方法 1: 単一のコラージュ画像
複数の元画像を 1 つのコラージュにまとめてから、希望する出力を説明します。

方法 2: 複数の個別画像(最大 14 枚)
複数の画像を直接渡します。Gemini 3 モデルは最大 14 枚の参照画像(オブジェクト + キャラクター)をサポートしています。
4K 画像生成
高解像度出力のために、aspect_ratio と image_size を含む image_config を指定します:
マルチターン画像編集(チャット)
SDK のチャット機能を使って、画像を段階的に改善できます:ヒント
プロンプトの最適化
プロンプトの最適化
スタイルのキーワード(例: “cyberpunk, film grain, low contrast”)、アスペクト比、被写体、背景、ライティング、詳細度を指定してください。
Base64 形式
Base64 形式
raw HTTP を使用する場合は、
data:image/png;base64, のプレフィックスを含めず、raw Base64 文字列のみを使用してください。Python SDK では、PIL.Image オブジェクトによってこれが自動的に処理されます。画像出力を強制する
画像出力を強制する
テキストなしで画像出力を保証するには、
"responseModalities" を ["IMAGE"] のみに設定してください。