Inférence économique pour les modèles open-weight

Exécutez des modèles open-weight — MiniMax, Kimi, GLM 5.2 — à des tarifs fixes en USD par jeton avec un point de terminaison compatible OpenAI.

Open-weight, prix bas

Modèles open-weight sur une infrastructure rentable avec une marge fixe en USD — environ 10× moins cher par jeton qu'OpenRouter pour le même modèle. Prévisible, sans abonnement.

Compatible OpenAI drop-in

La même API OpenAI, les mêmes modèles open-weight — juste une URL de base et une clé différentes. Paiement à l'usage à partir d'un solde en USD rechargé en USDT. Pas de carte, pas de KYC.

Drop-in : changez l'URL de base

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Même modèle, une fraction du prix

Tarifs par million de jetons comparés à OpenRouter sur le même modèle.

Modèle OpenRouter cheaptokens Vous économisez
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× moins cher
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× moins cher

Mêmes modèles. USD pour 1M de jetons (entrée / sortie). OpenRouter est affiché pour comparaison. · Ouvrir le calculateur de coûts

FAQ

Hermes se connecte-t-il via l'API OpenAI ?

Oui — pointez Hermes vers notre URL de base compatible OpenAI et votre clé.

Les exécutions agentiques en plusieurs étapes sont-elles prises en charge ?

Oui — l'utilisation d'outils et les flux de travail en plusieurs étapes sont transmis sans modification.

La tarification est-elle fixe pendant une exécution ?

Oui — le tarif en USD par modèle et par jeton ne change pas en cours d'exécution.

Inférence open-weight économique

Créez un compte, rechargez avec de l'USDT et pointez votre client vers cheaptokens.

Commencer

Les noms des modèles open-weight sont des marques déposées de leurs propriétaires respectifs. Compatible via l'API standard OpenAI.