Inferenza economica per modelli open-weight

Esegui modelli open-weight — MiniMax, Kimi, GLM 5.2 — a tariffe fisse in USD per token con un endpoint compatibile con OpenAI drop-in.

Inizia ora

inference

$ export OPENAI_BASE_URL=https://api.cheaptokens.dev/v1
› ready · model minimax-m2.7
  open-weight · fixed USD · ~10× cheaper
▌

Open-weight, a basso costo

Modelli open-weight su infrastrutture efficienti con un margine fisso in USD — circa 10× meno per token rispetto a OpenRouter sullo stesso modello. Prevedibile, nessun abbonamento.

Drop-in compatibile con OpenAI

Stessa API OpenAI, stessi modelli open-weight — solo un URL di base e una chiave diversi. Pagamento a consumo da un saldo in USD ricaricato con USDT. Niente carte, niente KYC.

Drop-in: cambia l'URL di base

env

# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Stesso modello, una frazione del prezzo

Tariffe per milione di token rispetto a OpenRouter sullo stesso modello.

Modello	OpenRouter	cheaptokens	Risparmi
MiniMax-M2.7	$0.24 / $0.96	$0.025 / $0.1	~10× più economico
Kimi-K2.6	$0.66 / $3.41	$0.07 / $0.35	~9× più economico

Stessi modelli. USD per 1M token (input / output). OpenRouter mostrato per confronto. · Apri calcolatore di costi

FAQ

Hermes si connette tramite l'API di OpenAI?

Sì: punta Hermes al nostro URL di base compatibile con OpenAI e alla tua chiave.

Sono supportate le esecuzioni agentiche in più passaggi?

Sì: l'uso degli strumenti e i flussi di lavoro in più passaggi vengono trasmessi senza modifiche.

Il prezzo è fisso durante un'esecuzione?

Sì: il costo in USD per modello e per token non cambia durante l'esecuzione.

Casi d'uso correlati

Per agenti AI Token AI più economici Per la programmazione

Inferenza open-weight economica

Crea un account, ricarica con USDT e punta il tuo client su cheaptokens.

Inizia ora

I nomi dei modelli open-weight sono marchi dei rispettivi proprietari. Compatibile tramite l'API standard OpenAI.