Дешевий інференс для open-weight моделей
Запускайте open-weight моделі — MiniMax, Kimi, GLM 5.2 — за фіксованими тарифами в USD за токен через drop-in OpenAI-сумісний ендпоінт.
Open-weight за низькою ціною
Open-weight моделі на економічно ефективній інфраструктурі з фіксованою маржею в USD — приблизно у 10 разів дешевше за токен, ніж на OpenRouter для тієї ж моделі. Передбачувано, без підписок.
Drop-in OpenAI-сумісність
Той самий OpenAI API, ті самі open-weight моделі — просто інший базовий URL та ключ. Оплата за фактом використання з балансу в USD, який поповнюється через USDT. Без карток, без KYC.
Drop-in: змініть базовий URL
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY" Та сама модель, частка ціни
Тарифи за мільйон токенів порівняно з OpenRouter для тієї ж моделі.
| Модель | OpenRouter | cheaptokens | Ви економите |
|---|---|---|---|
| MiniMax-M2.7 | $0.24 / $0.96 | $0.025 / $0.1 | ~10× дешевше |
| Kimi-K2.6 | $0.66 / $3.41 | $0.07 / $0.35 | ~9× дешевше |
Ті самі моделі. Ціна в USD за 1 млн токенів (вхідні / вихідні). OpenRouter наведено для порівняння. · Відкрити калькулятор вартості
FAQ
Чи підключається Hermes через OpenAI API?
Так — вкажіть Hermes наш базовий URL, сумісний з OpenAI, та ключ.
Чи підтримуються агентні багатоетапні запуски?
Так — використання інструментів та багатоетапні робочі процеси проходять без змін.
Чи є ціна фіксованою під час виконання?
Так — ціна в доларах США за модель та за токен не змінюється під час виконання.
Пов'язані варіанти використання
Дешевий інференс open-weight моделей
Створіть акаунт, поповніть баланс через USDT та спрямуйте свій клієнт на cheaptokens.
Почати роботуНазви open-weight моделей є торговими марками відповідних власників. Сумісність через стандартний OpenAI API.