Murang inference para sa mga open-weight model

Patakbuhin ang mga open-weight model — MiniMax, Kimi, GLM 5.2 — sa fixed na rate ng USD bawat token gamit ang drop-in na endpoint na compatible sa OpenAI.

Open-weight, mababang presyo

Mga open-weight model sa cost-efficient na imprastraktura sa fixed na margin ng USD — humigit-kumulang 10× na mas mababa bawat token kaysa sa OpenRouter para sa parehong model. Predictable, walang subscription.

Drop-in na compatible sa OpenAI

Parehong OpenAI API, parehong mga open-weight model — ibang base URL at key lang. Pay-as-you-go mula sa balanse ng USD na nilagyan ng USDT. Walang card, walang KYC.

Drop-in: palitan ang base URL

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Parehong model, maliit na bahagi lang ng presyo

Mga rate bawat milyong token kumpara sa OpenRouter para sa parehong model.

Modelo OpenRouter cheaptokens Makakatipid ka ng
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× mas mura
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× mas mura

Parehong mga modelo. USD bawat 1M tokens (input / output). Ipinapakita ang OpenRouter para sa paghahambing. · Buksan ang cost calculator

FAQ

Kumokonekta ba ang Hermes sa pamamagitan ng OpenAI API?

Oo — ituro ang Hermes sa aming OpenAI-compatible na base URL at key.

Suportado ba ang mga agentic, multi-step na run?

Oo — ang paggamit ng tool at mga multi-step na workflow ay dumadaan nang walang pagbabago.

Fixed ba ang presyo habang tumatakbo ang isang run?

Oo — bawat modelo, bawat token sa USD na hindi nagbabago sa gitna ng run.

Murang open-weight inference

Gumawa ng account, mag-top up gamit ang USDT, at ituro ang iyong client sa cheaptokens.

Magsimula

Ang mga pangalan ng open-weight model ay mga trademark ng kani-kanilang mga may-ari. Compatible sa pamamagitan ng standard na OpenAI API.