Günstige Inferenz für Open-Weight-Modelle
Nutzen Sie Open-Weight-Modelle — MiniMax, Kimi, GLM 5.2 — zu festen USD-Preisen pro Token mit einem Drop-in OpenAI-kompatiblen Endpunkt.
Open-Weight, günstig bepreist
Open-Weight-Modelle auf kosteneffizienter Infrastruktur mit einer festen USD-Marge — etwa 10× weniger pro Token als OpenRouter für dasselbe Modell. Vorhersehbar, kein Abonnement.
Drop-in OpenAI-kompatibel
Gleiche OpenAI-API, gleiche Open-Weight-Modelle — nur eine andere Basis-URL und ein anderer Schlüssel. Pay-as-you-go mit einem USD-Guthaben, das mit USDT aufgeladen wird. Keine Karten, kein KYC.
Drop-in: Ändern Sie die Basis-URL
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" Dasselbe Modell, ein Bruchteil des Preises
Preise pro Million Token im Vergleich zu OpenRouter für dasselbe Modell.
| Modell | OpenRouter | cheaptokens | Sie sparen |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× günstiger |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× günstiger |
Gleiche Modelle. USD pro 1 Mio. Token (Input / Output). OpenRouter dient zum Vergleich. · Kostenrechner öffnen
FAQ
Verbindet sich Hermes über die OpenAI-API?
Ja – geben Sie Hermes unsere OpenAI-kompatible Basis-URL und den Schlüssel an.
Werden agentische, mehrstufige Ausführungen unterstützt?
Ja – Tool-Nutzung und mehrstufige Workflows werden unverändert durchgereicht.
Ist die Preisgestaltung während einer Ausführung fix?
Ja – pro Modell und pro Token in USD, was sich während der Ausführung nicht ändert.
Verwandte Anwendungsfälle
Günstige Open-Weight-Inferenz
Erstellen Sie ein Konto, laden Sie es mit USDT auf und richten Sie Ihren Client auf cheaptokens aus.
Jetzt startenDie Namen der Open-Weight-Modelle sind Marken ihrer jeweiligen Eigentümer. Kompatibel über die Standard-OpenAI-API.