开源模型低价推理

以固定的美元代币价格,通过 OpenAI 兼容接口运行 MiniMax、Kimi、GLM 5.2 等开源模型。

开源模型,低价畅享

在高效基础设施上运行开源模型,并保持固定的美元利润率——在相同模型下,每代币成本比 OpenRouter 低约 10 倍。价格可预测,无需订阅。

即插即用,兼容 OpenAI

相同的 OpenAI API,相同的开源模型——只需更改基础 URL 和密钥。使用 USDT 充值余额,按量付费。无需信用卡,无需 KYC。

即插即用:只需更改基础 URL

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

相同模型,价格仅为一小部分

与 OpenRouter 在相同模型下的每百万代币费率对比。

模型 OpenRouter cheaptokens 您节省了
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× 更便宜
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× 更便宜

相同模型。每100万 tokens 的美元价格(输入/输出)。OpenRouter 仅供对比参考。 · 打开成本计算器

FAQ

Hermes 是否通过 OpenAI API 连接?

是的 — 只需将 Hermes 指向我们兼容 OpenAI 的基础 URL 和密钥即可。

是否支持代理式、多步骤运行?

是的 — 工具使用和多步骤工作流程均可原样通过。

运行期间定价是否固定?

是的 — 按模型、按 Token 的美元定价在运行过程中不会发生变化。

低价开源模型推理

创建账户,使用 USDT 充值,并将您的客户端指向 cheaptokens。

开始使用

开源模型名称均为其各自所有者的商标。通过标准 OpenAI API 兼容。