Inférence économique pour les modèles open-weight
Exécutez des modèles open-weight — MiniMax, Kimi, GLM 5.2 — à des tarifs fixes en USD par jeton avec un point de terminaison compatible OpenAI.
Open-weight, prix bas
Modèles open-weight sur une infrastructure rentable avec une marge fixe en USD — environ 10× moins cher par jeton qu'OpenRouter pour le même modèle. Prévisible, sans abonnement.
Compatible OpenAI drop-in
La même API OpenAI, les mêmes modèles open-weight — juste une URL de base et une clé différentes. Paiement à l'usage à partir d'un solde en USD rechargé en USDT. Pas de carte, pas de KYC.
Drop-in : changez l'URL de base
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" Même modèle, une fraction du prix
Tarifs par million de jetons comparés à OpenRouter sur le même modèle.
| Modèle | OpenRouter | cheaptokens | Vous économisez |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× moins cher |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× moins cher |
Mêmes modèles. USD pour 1M de jetons (entrée / sortie). OpenRouter est affiché pour comparaison. · Ouvrir le calculateur de coûts
FAQ
Hermes se connecte-t-il via l'API OpenAI ?
Oui — pointez Hermes vers notre URL de base compatible OpenAI et votre clé.
Les exécutions agentiques en plusieurs étapes sont-elles prises en charge ?
Oui — l'utilisation d'outils et les flux de travail en plusieurs étapes sont transmis sans modification.
La tarification est-elle fixe pendant une exécution ?
Oui — le tarif en USD par modèle et par jeton ne change pas en cours d'exécution.
Cas d'utilisation associés
Inférence open-weight économique
Créez un compte, rechargez avec de l'USDT et pointez votre client vers cheaptokens.
CommencerLes noms des modèles open-weight sont des marques déposées de leurs propriétaires respectifs. Compatible via l'API standard OpenAI.