Inferenza economica per modelli open-weight
Esegui modelli open-weight — MiniMax, Kimi, GLM 5.2 — a tariffe fisse in USD per token con un endpoint compatibile con OpenAI drop-in.
Open-weight, a basso costo
Modelli open-weight su infrastrutture efficienti con un margine fisso in USD — circa 10× meno per token rispetto a OpenRouter sullo stesso modello. Prevedibile, nessun abbonamento.
Drop-in compatibile con OpenAI
Stessa API OpenAI, stessi modelli open-weight — solo un URL di base e una chiave diversi. Pagamento a consumo da un saldo in USD ricaricato con USDT. Niente carte, niente KYC.
Drop-in: cambia l'URL di base
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" Stesso modello, una frazione del prezzo
Tariffe per milione di token rispetto a OpenRouter sullo stesso modello.
| Modello | OpenRouter | cheaptokens | Risparmi |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× più economico |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× più economico |
Stessi modelli. USD per 1M token (input / output). OpenRouter mostrato per confronto. · Apri calcolatore di costi
FAQ
Hermes si connette tramite l'API di OpenAI?
Sì: punta Hermes al nostro URL di base compatibile con OpenAI e alla tua chiave.
Sono supportate le esecuzioni agentiche in più passaggi?
Sì: l'uso degli strumenti e i flussi di lavoro in più passaggi vengono trasmessi senza modifiche.
Il prezzo è fisso durante un'esecuzione?
Sì: il costo in USD per modello e per token non cambia durante l'esecuzione.
Casi d'uso correlati
Inferenza open-weight economica
Crea un account, ricarica con USDT e punta il tuo client su cheaptokens.
Inizia oraI nomi dei modelli open-weight sono marchi dei rispettivi proprietari. Compatibile tramite l'API standard OpenAI.