오픈 웨이트 모델을 위한 저렴한 추론
MiniMax, Kimi, GLM 5.2와 같은 오픈 웨이트 모델을 OpenAI 호환 엔드포인트를 통해 고정된 USD 토큰당 요금으로 실행하세요.
낮은 가격의 오픈 웨이트 모델
비용 효율적인 인프라에서 고정된 USD 마진으로 오픈 웨이트 모델을 제공합니다. 동일 모델 기준 OpenRouter보다 토큰당 약 10배 저렴합니다. 구독료 없이 예측 가능한 비용으로 이용하세요.
OpenAI 호환 드롭인 방식
동일한 OpenAI API와 오픈 웨이트 모델을 그대로 사용하세요. 베이스 URL과 키만 변경하면 됩니다. USDT로 충전한 USD 잔액으로 사용한 만큼만 지불하세요. 카드나 KYC 인증이 필요 없습니다.
드롭인: 베이스 URL만 변경하세요
env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" 동일한 모델, 훨씬 저렴한 가격
동일 모델 기준 OpenRouter 대비 백만 토큰당 요금 비교.
| 모델 | OpenRouter | cheaptokens | 절약 금액 |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× 더 저렴함 |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× 더 저렴함 |
동일한 모델. 1M 토큰당 USD 가격 (입력 / 출력). 비교를 위해 OpenRouter 가격을 표시합니다. · 비용 계산기 열기
FAQ
Hermes는 OpenAI API를 통해 연결되나요?
네 — Hermes를 저희의 OpenAI 호환 기본 URL 및 키로 설정하세요.
에이전트 기반의 다단계 실행이 지원되나요?
네 — 도구 사용 및 다단계 워크플로우는 변경 없이 그대로 전달됩니다.
실행 중에 가격이 고정되어 있나요?
네 — 모델별, 토큰별 USD 가격은 실행 도중에 변경되지 않습니다.
관련 사용 사례
저렴한 오픈 웨이트 추론
계정을 생성하고 USDT로 충전한 뒤, 클라이언트를 cheaptokens로 설정하세요.
시작하기오픈 웨이트 모델 이름은 각 소유자의 상표입니다. 표준 OpenAI API를 통해 호환됩니다.