Inferência barata para modelos de pesos abertos
Execute modelos de pesos abertos — MiniMax, Kimi, GLM 5.2 — a taxas fixas em USD por token com um endpoint compatível com OpenAI drop-in.
Pesos abertos, preço baixo
Modelos de pesos abertos em infraestrutura de baixo custo com uma margem fixa em USD — aproximadamente 10× menos por token do que o OpenRouter no mesmo modelo. Previsível, sem assinatura.
Compatível com OpenAI drop-in
A mesma API OpenAI, os mesmos modelos de pesos abertos — apenas uma URL base e chave diferentes. Pague conforme o uso a partir de um saldo em USD recarregado com USDT. Sem cartões, sem KYC.
Drop-in: altere a URL base
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" Mesmo modelo, uma fração do preço
Taxas por milhão de tokens versus OpenRouter no mesmo modelo.
| Modelo | OpenRouter | cheaptokens | Você economiza |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× mais barato |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× mais barato |
Mesmos modelos. USD por 1M tokens (entrada / saída). OpenRouter exibido para comparação. · Abrir calculadora de custos
FAQ
O Hermes se conecta através da API da OpenAI?
Sim — aponte o Hermes para nossa URL base compatível com a OpenAI e sua chave.
Execuções agenticas de várias etapas são suportadas?
Sim — o uso de ferramentas e fluxos de trabalho de várias etapas são processados sem alterações.
O preço é fixo durante uma execução?
Sim — o valor em USD por modelo e por token não muda durante a execução.
Casos de uso relacionados
Inferência barata de pesos abertos
Crie uma conta, recarregue com USDT e aponte seu cliente para a cheaptokens.
Começar agoraOs nomes dos modelos de pesos abertos são marcas registradas de seus respectivos proprietários. Compatível via API padrão da OpenAI.