Inferensi murah untuk model open-weight

Jalankan model open-weight — MiniMax, Kimi, GLM 5.2 — dengan tarif USD per-token tetap menggunakan endpoint yang kompatibel dengan OpenAI.

Open-weight, harga rendah

Model open-weight pada infrastruktur yang hemat biaya dengan margin USD tetap — sekitar 10× lebih murah per token dibandingkan OpenRouter untuk model yang sama. Dapat diprediksi, tanpa langganan.

Drop-in kompatibel dengan OpenAI

API OpenAI yang sama, model open-weight yang sama — hanya dengan base URL dan kunci yang berbeda. Bayar sesuai pemakaian dari saldo USD yang diisi ulang dengan USDT. Tanpa kartu, tanpa KYC.

Drop-in: ubah base URL

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Model yang sama, harga jauh lebih murah

Tarif per-juta-token dibandingkan dengan OpenRouter untuk model yang sama.

Model OpenRouter cheaptokens Anda hemat
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× lebih murah
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× lebih murah

Model yang sama. USD per 1 Juta token (input / output). OpenRouter ditampilkan sebagai perbandingan. · Buka kalkulator biaya

FAQ

Apakah Hermes terhubung melalui API OpenAI?

Ya — arahkan Hermes ke URL dasar dan kunci kami yang kompatibel dengan OpenAI.

Apakah alur kerja agenik multi-langkah didukung?

Ya — penggunaan alat dan alur kerja multi-langkah dapat berjalan tanpa perubahan.

Apakah harga tetap selama proses berjalan?

Ya — harga per model, per token dalam USD yang tidak berubah di tengah proses.

Inferensi open-weight murah

Buat akun, isi ulang dengan USDT, dan arahkan klien Anda ke cheaptokens.

Mulai sekarang

Nama model open-weight adalah merek dagang dari pemiliknya masing-masing. Kompatibel melalui API OpenAI standar.