Inferenza economica per modelli open-weight

Esegui modelli open-weight — MiniMax, Kimi, GLM 5.2 — a tariffe fisse in USD per token con un endpoint compatibile con OpenAI drop-in.

Open-weight, a basso costo

Modelli open-weight su infrastrutture efficienti con un margine fisso in USD — circa 10× meno per token rispetto a OpenRouter sullo stesso modello. Prevedibile, nessun abbonamento.

Drop-in compatibile con OpenAI

Stessa API OpenAI, stessi modelli open-weight — solo un URL di base e una chiave diversi. Pagamento a consumo da un saldo in USD ricaricato con USDT. Niente carte, niente KYC.

Drop-in: cambia l'URL di base

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Stesso modello, una frazione del prezzo

Tariffe per milione di token rispetto a OpenRouter sullo stesso modello.

Modello OpenRouter cheaptokens Risparmi
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× più economico
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× più economico

Stessi modelli. USD per 1M token (input / output). OpenRouter mostrato per confronto. · Apri calcolatore di costi

FAQ

Hermes si connette tramite l'API di OpenAI?

Sì: punta Hermes al nostro URL di base compatibile con OpenAI e alla tua chiave.

Sono supportate le esecuzioni agentiche in più passaggi?

Sì: l'uso degli strumenti e i flussi di lavoro in più passaggi vengono trasmessi senza modifiche.

Il prezzo è fisso durante un'esecuzione?

Sì: il costo in USD per modello e per token non cambia durante l'esecuzione.

Inferenza open-weight economica

Crea un account, ricarica con USDT e punta il tuo client su cheaptokens.

Inizia ora

I nomi dei modelli open-weight sono marchi dei rispettivi proprietari. Compatibile tramite l'API standard OpenAI.