Langsung ke konten utama
POST
/
v1
/
embeddings
from openai import OpenAI

client = OpenAI(
    base_url="https://api.cometapi.com/v1",
    api_key="<COMETAPI_KEY>",
)

response = client.embeddings.create(
    model="text-embedding-3-small",
    input="The food was delicious and the waiter was friendly.",
)

print(response.data[0].embedding[:5])  # First 5 dimensions
print(f"Dimensions: {len(response.data[0].embedding)}")
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [
        -0.0021,
        -0.0491,
        0.0209,
        0.0314,
        -0.0453
      ]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 2,
    "total_tokens": 2
  }
}

Ringkasan

API Embeddings menghasilkan representasi vektor dari teks yang menangkap makna semantik. Vektor ini dapat digunakan untuk pencarian semantik, clustering, klasifikasi, deteksi anomali, dan retrieval-augmented generation (RAG). CometAPI mendukung model embedding dari banyak provider. Kirim satu atau lebih string teks dan terima kembali vektor numerik yang dapat Anda simpan di database vektor atau gunakan langsung untuk perhitungan kemiripan.

Model yang Tersedia

ModelDimensiMaks TokenPaling Cocok Untuk
text-embedding-3-large3,072 (dapat disesuaikan)8,191Embeddings kualitas tertinggi
text-embedding-3-small1,536 (dapat disesuaikan)8,191Hemat biaya, cepat
text-embedding-ada-0021,536 (tetap)8,191Kompatibilitas legacy
Lihat daftar model untuk semua model embedding yang tersedia dan harganya.

Catatan Penting

Mengurangi Dimensi — Model text-embedding-3-* mendukung parameter dimensions, yang memungkinkan Anda memendekkan vektor embedding tanpa kehilangan akurasi yang signifikan. Ini dapat mengurangi biaya penyimpanan hingga 75% sambil tetap mempertahankan sebagian besar informasi semantik.
Batch Input — Anda dapat membuat embedding untuk beberapa teks dalam satu request dengan mengirim array string ke parameter input. Ini jauh lebih efisien daripada membuat request terpisah untuk setiap teks.

Otorisasi

Authorization
string
header
wajib

Bearer token authentication. Use your CometAPI key.

Body

application/json
model
string
wajib

The embedding model to use. See the Models page for current embedding model IDs.

Contoh:

"text-embedding-3-small"

input
wajib

The text to embed. Can be a single string, an array of strings, or an array of token arrays. Each input must not exceed the model's maximum token limit (8,191 tokens for text-embedding-3-* models).

encoding_format
enum<string>
default:float

The format of the returned embedding vectors. float returns an array of floating-point numbers. base64 returns a base64-encoded string representation, which can reduce response size for large batches.

Opsi yang tersedia:
float,
base64
dimensions
integer

The number of dimensions for the output embedding vector. Only supported by text-embedding-3-* models. Reducing dimensions can lower storage costs while maintaining most of the embedding's utility.

Rentang yang diperlukan: x >= 1
user
string

A unique identifier for your end-user, which can help monitor and detect abuse.

Respons

200 - application/json

A list of embedding vectors for the input text(s).

object
enum<string>

The object type, always list.

Opsi yang tersedia:
list
Contoh:

"list"

data
object[]

An array of embedding objects, one per input text. When multiple inputs are provided, results are returned in the same order as the input.

model
string

The model used to generate the embeddings.

Contoh:

"text-embedding-3-small"

usage
object

Token usage statistics for this request.