Murang inference para sa mga open-weight model
Patakbuhin ang mga open-weight model — MiniMax, Kimi, GLM 5.2 — sa fixed na rate ng USD bawat token gamit ang drop-in na endpoint na compatible sa OpenAI.
Open-weight, mababang presyo
Mga open-weight model sa cost-efficient na imprastraktura sa fixed na margin ng USD — humigit-kumulang 10× na mas mababa bawat token kaysa sa OpenRouter para sa parehong model. Predictable, walang subscription.
Drop-in na compatible sa OpenAI
Parehong OpenAI API, parehong mga open-weight model — ibang base URL at key lang. Pay-as-you-go mula sa balanse ng USD na nilagyan ng USDT. Walang card, walang KYC.
Drop-in: palitan ang base URL
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" Parehong model, maliit na bahagi lang ng presyo
Mga rate bawat milyong token kumpara sa OpenRouter para sa parehong model.
| Modelo | OpenRouter | cheaptokens | Makakatipid ka ng |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× mas mura |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× mas mura |
Parehong mga modelo. USD bawat 1M tokens (input / output). Ipinapakita ang OpenRouter para sa paghahambing. · Buksan ang cost calculator
FAQ
Kumokonekta ba ang Hermes sa pamamagitan ng OpenAI API?
Oo — ituro ang Hermes sa aming OpenAI-compatible na base URL at key.
Suportado ba ang mga agentic, multi-step na run?
Oo — ang paggamit ng tool at mga multi-step na workflow ay dumadaan nang walang pagbabago.
Fixed ba ang presyo habang tumatakbo ang isang run?
Oo — bawat modelo, bawat token sa USD na hindi nagbabago sa gitna ng run.
Mga kaugnay na use case
Murang open-weight inference
Gumawa ng account, mag-top up gamit ang USDT, at ituro ang iyong client sa cheaptokens.
MagsimulaAng mga pangalan ng open-weight model ay mga trademark ng kani-kanilang mga may-ari. Compatible sa pamamagitan ng standard na OpenAI API.