Inferensi murah untuk model open-weight
Jalankan model open-weight — MiniMax, Kimi, GLM 5.2 — dengan tarif USD per-token tetap menggunakan endpoint yang kompatibel dengan OpenAI.
Open-weight, harga rendah
Model open-weight pada infrastruktur yang hemat biaya dengan margin USD tetap — sekitar 10× lebih murah per token dibandingkan OpenRouter untuk model yang sama. Dapat diprediksi, tanpa langganan.
Drop-in kompatibel dengan OpenAI
API OpenAI yang sama, model open-weight yang sama — hanya dengan base URL dan kunci yang berbeda. Bayar sesuai pemakaian dari saldo USD yang diisi ulang dengan USDT. Tanpa kartu, tanpa KYC.
Drop-in: ubah base URL
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" Model yang sama, harga jauh lebih murah
Tarif per-juta-token dibandingkan dengan OpenRouter untuk model yang sama.
| Model | OpenRouter | cheaptokens | Anda hemat |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× lebih murah |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× lebih murah |
Model yang sama. USD per 1 Juta token (input / output). OpenRouter ditampilkan sebagai perbandingan. · Buka kalkulator biaya
FAQ
Apakah Hermes terhubung melalui API OpenAI?
Ya — arahkan Hermes ke URL dasar dan kunci kami yang kompatibel dengan OpenAI.
Apakah alur kerja agenik multi-langkah didukung?
Ya — penggunaan alat dan alur kerja multi-langkah dapat berjalan tanpa perubahan.
Apakah harga tetap selama proses berjalan?
Ya — harga per model, per token dalam USD yang tidak berubah di tengah proses.
Kasus penggunaan terkait
Inferensi open-weight murah
Buat akun, isi ulang dengan USDT, dan arahkan klien Anda ke cheaptokens.
Mulai sekarangNama model open-weight adalah merek dagang dari pemiliknya masing-masing. Kompatibel melalui API OpenAI standar.