Inférence économique pour les modèles open-weight

Exécutez des modèles open-weight — MiniMax, Kimi, GLM 5.2 — à des tarifs fixes en USD par jeton avec un point de terminaison compatible OpenAI.

Commencer

inference

$ export OPENAI_BASE_URL=https://api.cheaptokens.dev/v1
› ready · model minimax-m2.7
  open-weight · fixed USD · ~10× cheaper
▌

Open-weight, prix bas

Modèles open-weight sur une infrastructure rentable avec une marge fixe en USD — environ 10× moins cher par jeton qu'OpenRouter pour le même modèle. Prévisible, sans abonnement.

Compatible OpenAI drop-in

La même API OpenAI, les mêmes modèles open-weight — juste une URL de base et une clé différentes. Paiement à l'usage à partir d'un solde en USD rechargé en USDT. Pas de carte, pas de KYC.

Drop-in : changez l'URL de base

env

# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Même modèle, une fraction du prix

Tarifs par million de jetons comparés à OpenRouter sur le même modèle.

Modèle	OpenRouter	cheaptokens	Vous économisez
MiniMax-M2.7	$0.24 / $0.96	$0.025 / $0.1	~10× moins cher
Kimi-K2.6	$0.66 / $3.41	$0.07 / $0.35	~9× moins cher

Mêmes modèles. USD pour 1M de jetons (entrée / sortie). OpenRouter est affiché pour comparaison. · Ouvrir le calculateur de coûts

FAQ

Hermes se connecte-t-il via l'API OpenAI ?

Oui — pointez Hermes vers notre URL de base compatible OpenAI et votre clé.

Les exécutions agentiques en plusieurs étapes sont-elles prises en charge ?

Oui — l'utilisation d'outils et les flux de travail en plusieurs étapes sont transmis sans modification.

La tarification est-elle fixe pendant une exécution ?

Oui — le tarif en USD par modèle et par jeton ne change pas en cours d'exécution.

Cas d'utilisation associés

Pour les agents IA Jetons IA les moins chers Pour le codage

Inférence open-weight économique

Créez un compte, rechargez avec de l'USDT et pointez votre client vers cheaptokens.

Commencer

Les noms des modèles open-weight sont des marques déposées de leurs propriétaires respectifs. Compatible via l'API standard OpenAI.