Inferência barata para modelos de pesos abertos

Execute modelos de pesos abertos — MiniMax, Kimi, GLM 5.2 — a taxas fixas em USD por token com um endpoint compatível com OpenAI drop-in.

Pesos abertos, preço baixo

Modelos de pesos abertos em infraestrutura de baixo custo com uma margem fixa em USD — aproximadamente 10× menos por token do que o OpenRouter no mesmo modelo. Previsível, sem assinatura.

Compatível com OpenAI drop-in

A mesma API OpenAI, os mesmos modelos de pesos abertos — apenas uma URL base e chave diferentes. Pague conforme o uso a partir de um saldo em USD recarregado com USDT. Sem cartões, sem KYC.

Drop-in: altere a URL base

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Mesmo modelo, uma fração do preço

Taxas por milhão de tokens versus OpenRouter no mesmo modelo.

Modelo OpenRouter cheaptokens Você economiza
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× mais barato
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× mais barato

Mesmos modelos. USD por 1M tokens (entrada / saída). OpenRouter exibido para comparação. · Abrir calculadora de custos

FAQ

O Hermes se conecta através da API da OpenAI?

Sim — aponte o Hermes para nossa URL base compatível com a OpenAI e sua chave.

Execuções agenticas de várias etapas são suportadas?

Sim — o uso de ferramentas e fluxos de trabalho de várias etapas são processados sem alterações.

O preço é fixo durante uma execução?

Sim — o valor em USD por modelo e por token não muda durante a execução.

Inferência barata de pesos abertos

Crie uma conta, recarregue com USDT e aponte seu cliente para a cheaptokens.

Começar agora

Os nomes dos modelos de pesos abertos são marcas registradas de seus respectivos proprietários. Compatível via API padrão da OpenAI.