All systems operational99.9% Uptime SLASOC 2 Compliant

PT. XESS ONE GLOBAL

All systems operational99.9% Uptime SLASOC 2 Compliant

PT. XESS ONE GLOBAL

XESS AI

Semua model AI top
dalam satu API Rupiah.

Claude Haiku/Sonnet/Opus untuk kualitas premium. Llama & Mistral untuk volume besar hemat. Satu endpoint, satu API key, bayar dari saldo Rupiah.

✓ OpenAI-compatible✓ Billing per request✓ Saldo tidak expired✓ Data ASEAN/EU (open-source)✓ Support WhatsApp
Premium Tier

Claude — kualitas top, harga premium

Model frontier dari Anthropic. Dipakai XessOne sendiri untuk semua fitur AI di dashboard dan 6 client SaaS. Markup 30% di atas harga USD Anthropic.

XO-Genius

Powered by Claude Opus 4.7

Premium

Model paling cerdas di dunia. Untuk tugas yang tidak boleh salah.

Input

Rp 312

per 1k token

Output

Rp 1.560

per 1k token

Context

1000k token

Speed

~45 tok/dt

Keunggulan

  • Reasoning frontier — matematika, sains, strategi
  • Context 1M token (≈ 750k kata)
  • Tugas multi-jam otonom (deep research)
  • Code review & arsitektur tingkat senior

Cocok untuk

  • Riset & analisa strategis mendalam
  • Legal / medis / finansial — konteks kompleks
  • Penulisan laporan eksekutif
  • Debug masalah sistem yang rumit
  • Planning & decision support untuk C-level

Hindari

Chatbot volume tinggi (pakai XO-Flash — 15× lebih murah)

💡 Kelas yang sama dengan GPT-5 & Gemini 2.5 Pro

Model ID

xo-genius

XO-Pro

Powered by Claude Sonnet 4.6

Premium

Default untuk produksi serius. Rasio kualitas/harga terbaik.

Input

Rp 62

per 1k token

Output

Rp 310

per 1k token

Context

200k token

Speed

~85 tok/dt

Keunggulan

  • Reasoning + coding top-tier
  • Tool use agentik multi-step reliable
  • Vision + long document analysis
  • Extended thinking untuk tugas kompleks

Cocok untuk

  • AI coding assistant / IDE integration
  • Agentic workflow (tool calling, web search)
  • RAG production — analisa dokumen hukum, kontrak
  • Summarization laporan finansial panjang
  • Content generation berkualitas (artikel, proposal)

💡 Setara/lebih baik dari GPT-5 mini, jauh lebih murah dari GPT-5

Model ID

xo-pro

XO-Flash

Powered by Claude Haiku 4.5

Premium

Tercepat di keluarga Claude. Kualitas premium, latensi rendah.

Input

Rp 21

per 1k token

Output

Rp 105

per 1k token

Context

200k token

Speed

~180 tok/dt

Keunggulan

  • Latensi <400ms — cocok realtime chat
  • Mengikuti instruksi rumit dengan akurat
  • Vision (gambar) + tool use support
  • Context window 200k token

Cocok untuk

  • Customer service chatbot (WhatsApp/web)
  • Klasifikasi dokumen, tagging, moderasi
  • Ekstraksi data dari invoice/KTP/receipt
  • Caption otomatis untuk produk e-commerce
  • Balasan template yang dipersonalisasi

💡 Setara GPT-4o mini tapi context 2× lebih besar

Model ID

xo-flash
Value Tier

Open-source via Vultr — hemat untuk volume

Powered by Vultr Serverless Inference — pay-per-token, elastic auto-scale. Markup 35%. Cocok untuk bulk processing, privacy, atau budget ketat.

XO-Titan

Powered by Qwen 3.5 397B MoE (A17B active)

Value

Mixture-of-Experts 397B. Alternatif XO-Pro untuk general workload berat, jauh lebih murah.

Input

Rp 19

Output

Rp 28

Context

256k

Speed

~110 tok/dt

Keunggulan

  • 397B total parameter, 17B active — performa kelas atas
  • Reasoning + instruction following strong
  • Multilingual 29+ bahasa termasuk Indonesia
  • Context 256k — fit dokumen panjang

Cocok untuk

  • General-purpose production app hemat
  • Analisa laporan panjang, RAG enterprise
  • Alternatif XO-Pro untuk budget-conscious
  • Agentic workflow volume tinggi

Hindari

High-stakes reasoning — pakai XO-Genius/Reasoner

💡 Setara GPT-4 / Claude 3.5, open-weight

Model ID

xo-titan

XO-Reasoner

Powered by DeepSeek V3.2 NVFP4

Value

Reasoning frontier-tier kompresi NVFP4. ~90% performa Opus di ~7% harganya.

Input

Rp 22

Output

Rp 52

Context

128k

Speed

~95 tok/dt

Keunggulan

  • Chain-of-thought reasoning kompetitif o1/Opus
  • Math olympiad + competitive coding grade
  • NVFP4 quantization — fast inference di NVIDIA Blackwell
  • Transparent reasoning trace (verifiable)

Cocok untuk

  • Math & logic problem solving
  • Code review mendalam + arsitektur
  • Analisa step-by-step (keuangan, legal)
  • Academic / research task hemat

Hindari

Chatbot conversational (pakai XO-Flash/Nano)

💡 Reasoning ~90% Opus, harga ~7% Opus

Model ID

xo-reasoner

XO-Coder

Powered by Mistral Devstral-2 123B

Value

Coding specialist kelas atas dari Mistral. Agentic software engineering native.

Input

Rp 16

Output

Rp 24

Context

256k

Speed

~100 tok/dt

Keunggulan

  • State-of-the-art coding benchmark (SWE-bench)
  • Native tool use + multi-file edit
  • Function calling reliable untuk agent
  • Context 256k — whole codebase fit

Cocok untuk

  • AI coding assistant / IDE integration
  • Code review otomatis + refactor besar
  • Agentic dev workflow (plan → edit → test)
  • Dokumentasi teknis & API docs generation

Hindari

Conversational chat umum (pakai XO-Flash)

💡 Setara Sonnet untuk coding, jauh lebih murah

Model ID

xo-coder

XO-Polyglot

Powered by Zhipu GLM-5.1 FP8

Value

Multilingual specialist CJK. Terbaik di kelasnya untuk Chinese, Japanese, Korean.

Input

Rp 8

Output

Rp 12

Context

128k

Speed

~130 tok/dt

Keunggulan

  • Unggul CJK (Chinese/Japanese/Korean) + ASEAN
  • Function calling native
  • Efisien FP8 — cepat + hemat
  • Kompetitif untuk translate profesional

Cocok untuk

  • Translation ID ↔ CN/JP/KR — terbaik untuk pasar Asia
  • Aplikasi untuk market Tiongkok/Taiwan/Hong Kong
  • Multilingual customer support Asia
  • Localization content ASEAN+East Asia

Hindari

English-only reasoning berat (pakai XO-Pro)

💡 Specialist CJK, unggul di pasar Asia

Model ID

xo-polyglot

XO-Open

Powered by OpenAI GPT-OSS 120B

Value

OpenAI's first open-weight model. Familiar behavior, tanpa vendor lock-in.

Input

Rp 12

Output

Rp 20

Context

128k

Speed

~115 tok/dt

Keunggulan

  • Karakteristik mirip GPT-4 (familiar)
  • Open-weight — full audit + compliance
  • Instruction following reliable
  • Migrasi mudah dari OpenAI API production

Cocok untuk

  • Migrasi dari OpenAI API tanpa refactor perilaku
  • Production app yang butuh 'feel' GPT
  • Compliance audit yang butuh open weights
  • General-purpose alternatif tiers premium

Hindari

Reasoning frontier — pakai XO-Reasoner/Genius

💡 GPT-4 class, open-source, jauh lebih murah

Model ID

xo-open

XO-Nano

Powered by MiniMax M2.7

Value

Ultra-fast, ultra-cheap. Untuk volume masif dengan budget minimum.

Input

Rp 3

Output

Rp 5

Context

64k

Speed

~250 tok/dt

Keunggulan

  • Paling murah + cepat di katalog XESS AI
  • Latensi super rendah (~200ms TTFB)
  • Cukup untuk tugas sederhana masif
  • Hemat 95% vs XO-Pro

Cocok untuk

  • Spam/toxicity filter ribuan pesan/detik
  • Tag/classify e-commerce product masif
  • Basic Q&A chatbot FAQ
  • Auto-response template sederhana

Hindari

Reasoning, coding, multilingual kompleks

💡 Entry-level — tradeoff kualitas vs harga ekstrim

Model ID

xo-nano

Pilih model yang tepat

Panduan cepat berdasarkan use case

1

Butuh intelligence paling tinggi — high-stakes, no-error?

Frontier reasoning untuk legal, medical, strategic — Claude Opus 4.7

XO-Genius
2

Production app dengan tool use + agentic workflow?

Best quality/price ratio, agentic reliable — Claude Sonnet 4.6

XO-Pro
3

Chatbot CS premium / extraction / vision?

Cepat + premium Claude — Haiku 4.5

XO-Flash
4

Reasoning mendalam tapi budget ketat?

DeepSeek V3.2 NVFP4 — ~90% Opus reasoning di 7% harganya

XO-Reasoner
5

Coding assistant agentic + long context codebase?

Mistral Devstral-2 123B — SWE-bench state-of-the-art, 256k context

XO-Coder
6

General production app hemat — alternatif XO-Pro?

Qwen 3.5 397B MoE — kelas GPT-4, open-weight, 256k context

XO-Titan
7

Migrasi dari OpenAI API tanpa ubah perilaku?

GPT-OSS 120B — OpenAI's open model, familiar behavior

XO-Open
8

Translate CJK / pasar China-Jepang-Korea?

Zhipu GLM-5.1 — specialist multilingual Asia

XO-Polyglot
9

Volume masif dengan budget paling minim?

MiniMax M2.7 — termurah + tercepat, cocok filter/tagging skala besar

XO-Nano

Prepaid Credits

Top-up sekali, pakai sampai habis. Saldo tidak expired. Custom amount mulai Rp 50.000.

Starter

Rp 50.000

≈ 800k input Sonnet atau 4M input Haiku atau 3.8M input Llama

Pilih Starter
POPULAR

Growth

Rp 250.000

≈ 4M input Sonnet atau 19M input Llama

Pilih Growth

Pro

Rp 1.000.000

≈ 16M input Sonnet atau 77M input Llama

Pilih Pro

Pembayaran: Transfer BCA · QRIS · Virtual Account Midtrans

API Documentation

Full API Reference

OpenAI-compatible. Drop-in replacement untuk Anthropic/OpenAI SDK.

1. Authentication

Setiap request wajib membawa API key di header Authorization. Dapatkan key kamu di dashboard setelah signup.

Authorization: Bearer xo_lic_YOUR_KEY_HERE

2. Endpoint

Base URL

https://ai.xessone.com/v1

Chat Completions (semua model)

POST /v1/chat/completions

Anthropic-native (Claude-only)

POST /v1/messages

List Models

GET /v1/models

Check Balance

GET /v1/balance

3. Quickstart — cURL

curl -X POST https://ai.xessone.com/v1/chat/completions \
  -H "Authorization: Bearer xo_lic_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "xo-pro",
    "messages": [
      {"role": "user", "content": "Halo, tolong buatkan email follow-up sales"}
    ],
    "max_tokens": 1024
  }'

4. Python (OpenAI SDK)

from openai import OpenAI

client = OpenAI(
    api_key="xo_lic_YOUR_KEY",
    base_url="https://ai.xessone.com/v1",
)

response = client.chat.completions.create(
    model="xo-pro",  # atau xo-flash, xo-reasoner, xo-prime, xo-coder, xo-nano
    messages=[
        {"role": "user", "content": "Summarize laporan penjualan Q3"}
    ],
)
print(response.choices[0].message.content)
print(f"Biaya: Rp {response.usage.cost_rp}")

5. TypeScript / Node.js

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.XESS_API_KEY,
  baseURL: "https://ai.xessone.com/v1",
});

const stream = await client.chat.completions.create({
  model: "xo-flash",
  messages: [{ role: "user", content: "Buatkan caption IG produk kopi" }],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content ?? "");
}

6. Response Format

Sama dengan OpenAI/Anthropic, plus field xess untuk info billing:

{
  "id": "chatcmpl-xo_abc123",
  "model": "xo-pro",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Berikut email follow-up..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 189,
    "total_tokens": 213
  },
  "xess": {
    "cost_rp": 60.07,
    "balance_rp": 49939.93,
    "request_id": "xo_req_01HXYZ..."
  }
}

7. Rate Limits

TierReq/menitToken/menit
Default (setelah signup)60100k
Saldo ≥ Rp 500k300500k
Enterprise (hubungi sales)CustomCustom

8. Error Codes

HTTPErrorArti
401invalid_api_keyAPI key salah/tidak aktif
402insufficient_balanceSaldo kurang — top-up dulu
403domain_not_allowedOrigin header tidak match domain binding
404model_not_foundModel ID tidak valid — cek /v1/models
429rate_limit_exceededRate limit terlampaui — tunggu 60 dt
500upstream_errorMasalah di Anthropic/Vultr — auto-retry 3×
503model_overloadedModel sibuk — coba ganti model

9. Privasi & Data

Konten prompt & response TIDAK disimpan. Kami hanya mencatat metadata (timestamp, token count, model) untuk billing.

Claude models: request diteruskan ke Anthropic (AS) — zero retention policy Anthropic berlaku.

Llama 3.3: Vultr Serverless Inference (SGP region) — data tidak keluar ASEAN.

Mistral: Vultr Serverless Inference (FRA region) — data tidak keluar Uni Eropa (GDPR-compliant).

Ready to go global?

Start deploying across 32 locations in minutes.

Rahma

Rahma

XessOne Support

Hi! I'm Rahma from XessOne. Ask me anything about our services, pricing, or how to get started.