Tania inferencja dla modeli open-weight
Uruchamiaj modele open-weight — MiniMax, Kimi, GLM 5.2 — w stałych stawkach USD za token dzięki punktowi końcowemu zgodnemu z OpenAI.
Open-weight, niska cena
Modele open-weight na efektywnej kosztowo infrastrukturze ze stałą marżą w USD — około 10× taniej za token niż w OpenRouter dla tego samego modelu. Przewidywalnie, bez subskrypcji.
Zgodność z OpenAI typu drop-in
To samo API OpenAI, te same modele open-weight — wystarczy inny bazowy adres URL i klucz. Płacisz za użycie z salda USD doładowywanego za pomocą USDT. Bez kart, bez KYC.
Drop-in: zmień bazowy adres URL
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" Ten sam model, ułamek ceny
Stawki za milion tokenów w porównaniu do OpenRouter dla tego samego modelu.
| Model | OpenRouter | cheaptokens | Oszczędzasz |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× taniej |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× taniej |
Te same modele. USD za 1 mln tokenów (wejście / wyjście). OpenRouter pokazany dla porównania. · Otwórz kalkulator kosztów
FAQ
Czy Hermes łączy się przez API OpenAI?
Tak — skieruj Hermes na nasz bazowy adres URL zgodny z OpenAI oraz klucz.
Czy obsługiwane są agentowe, wieloetapowe uruchomienia?
Tak — użycie narzędzi i wieloetapowe przepływy pracy przechodzą bez zmian.
Czy ceny są stałe podczas uruchomienia?
Tak — stawka USD za model i za token nie zmienia się w trakcie działania.
Powiązane przypadki użycia
Tania inferencja modeli open-weight
Utwórz konto, doładuj je za pomocą USDT i skieruj swojego klienta na cheaptokens.
RozpocznijNazwy modeli open-weight są znakami towarowymi ich odpowiednich właścicieli. Kompatybilność poprzez standardowe API OpenAI.