Дешевий інференс для open-weight моделей

Запускайте open-weight моделі — MiniMax, Kimi, GLM 5.2 — за фіксованими тарифами в USD за токен через drop-in OpenAI-сумісний ендпоінт.

Open-weight за низькою ціною

Open-weight моделі на економічно ефективній інфраструктурі з фіксованою маржею в USD — приблизно у 10 разів дешевше за токен, ніж на OpenRouter для тієї ж моделі. Передбачувано, без підписок.

Drop-in OpenAI-сумісність

Той самий OpenAI API, ті самі open-weight моделі — просто інший базовий URL та ключ. Оплата за фактом використання з балансу в USD, який поповнюється через USDT. Без карток, без KYC.

Drop-in: змініть базовий URL

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Та сама модель, частка ціни

Тарифи за мільйон токенів порівняно з OpenRouter для тієї ж моделі.

Модель OpenRouter cheaptokens Ви економите
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× дешевше
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× дешевше

Ті самі моделі. Ціна в USD за 1 млн токенів (вхідні / вихідні). OpenRouter наведено для порівняння. · Відкрити калькулятор вартості

FAQ

Чи підключається Hermes через OpenAI API?

Так — вкажіть Hermes наш базовий URL, сумісний з OpenAI, та ключ.

Чи підтримуються агентні багатоетапні запуски?

Так — використання інструментів та багатоетапні робочі процеси проходять без змін.

Чи є ціна фіксованою під час виконання?

Так — ціна в доларах США за модель та за токен не змінюється під час виконання.

Дешевий інференс open-weight моделей

Створіть акаунт, поповніть баланс через USDT та спрямуйте свій клієнт на cheaptokens.

Почати роботу

Назви open-weight моделей є торговими марками відповідних власників. Сумісність через стандартний OpenAI API.