Tania inferencja dla modeli open-weight

Uruchamiaj modele open-weight — MiniMax, Kimi, GLM 5.2 — w stałych stawkach USD za token dzięki punktowi końcowemu zgodnemu z OpenAI.

Open-weight, niska cena

Modele open-weight na efektywnej kosztowo infrastrukturze ze stałą marżą w USD — około 10× taniej za token niż w OpenRouter dla tego samego modelu. Przewidywalnie, bez subskrypcji.

Zgodność z OpenAI typu drop-in

To samo API OpenAI, te same modele open-weight — wystarczy inny bazowy adres URL i klucz. Płacisz za użycie z salda USD doładowywanego za pomocą USDT. Bez kart, bez KYC.

Drop-in: zmień bazowy adres URL

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Ten sam model, ułamek ceny

Stawki za milion tokenów w porównaniu do OpenRouter dla tego samego modelu.

Model OpenRouter cheaptokens Oszczędzasz
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× taniej
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× taniej

Te same modele. USD za 1 mln tokenów (wejście / wyjście). OpenRouter pokazany dla porównania. · Otwórz kalkulator kosztów

FAQ

Czy Hermes łączy się przez API OpenAI?

Tak — skieruj Hermes na nasz bazowy adres URL zgodny z OpenAI oraz klucz.

Czy obsługiwane są agentowe, wieloetapowe uruchomienia?

Tak — użycie narzędzi i wieloetapowe przepływy pracy przechodzą bez zmian.

Czy ceny są stałe podczas uruchomienia?

Tak — stawka USD za model i za token nie zmienia się w trakcie działania.

Tania inferencja modeli open-weight

Utwórz konto, doładuj je za pomocą USDT i skieruj swojego klienta na cheaptokens.

Rozpocznij

Nazwy modeli open-weight są znakami towarowymi ich odpowiednich właścicieli. Kompatybilność poprzez standardowe API OpenAI.