Günstige Inferenz für Open-Weight-Modelle

Nutzen Sie Open-Weight-Modelle — MiniMax, Kimi, GLM 5.2 — zu festen USD-Preisen pro Token mit einem Drop-in OpenAI-kompatiblen Endpunkt.

Open-Weight, günstig bepreist

Open-Weight-Modelle auf kosteneffizienter Infrastruktur mit einer festen USD-Marge — etwa 10× weniger pro Token als OpenRouter für dasselbe Modell. Vorhersehbar, kein Abonnement.

Drop-in OpenAI-kompatibel

Gleiche OpenAI-API, gleiche Open-Weight-Modelle — nur eine andere Basis-URL und ein anderer Schlüssel. Pay-as-you-go mit einem USD-Guthaben, das mit USDT aufgeladen wird. Keine Karten, kein KYC.

Drop-in: Ändern Sie die Basis-URL

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Dasselbe Modell, ein Bruchteil des Preises

Preise pro Million Token im Vergleich zu OpenRouter für dasselbe Modell.

Modell OpenRouter cheaptokens Sie sparen
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× günstiger
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× günstiger

Gleiche Modelle. USD pro 1 Mio. Token (Input / Output). OpenRouter dient zum Vergleich. · Kostenrechner öffnen

FAQ

Verbindet sich Hermes über die OpenAI-API?

Ja – geben Sie Hermes unsere OpenAI-kompatible Basis-URL und den Schlüssel an.

Werden agentische, mehrstufige Ausführungen unterstützt?

Ja – Tool-Nutzung und mehrstufige Workflows werden unverändert durchgereicht.

Ist die Preisgestaltung während einer Ausführung fix?

Ja – pro Modell und pro Token in USD, was sich während der Ausführung nicht ändert.

Günstige Open-Weight-Inferenz

Erstellen Sie ein Konto, laden Sie es mit USDT auf und richten Sie Ihren Client auf cheaptokens aus.

Jetzt starten

Die Namen der Open-Weight-Modelle sind Marken ihrer jeweiligen Eigentümer. Kompatibel über die Standard-OpenAI-API.