Suy luận giá rẻ cho các mô hình mã nguồn mở

Chạy các mô hình mã nguồn mở — MiniMax, Kimi, GLM 5.2 — với mức giá cố định theo token thông qua endpoint tương thích OpenAI.

Mã nguồn mở, giá thấp

Các mô hình mã nguồn mở trên cơ sở hạ tầng tối ưu chi phí với biên lợi nhuận USD cố định — rẻ hơn khoảng 10 lần mỗi token so với OpenRouter trên cùng một mô hình. Dự đoán được chi phí, không cần đăng ký thuê bao.

Tương thích trực tiếp với OpenAI

Cùng một API OpenAI, cùng các mô hình mã nguồn mở — chỉ cần thay đổi base URL và khóa API. Thanh toán theo mức sử dụng từ số dư USD nạp bằng USDT. Không cần thẻ, không cần KYC.

Thay thế trực tiếp: chỉ cần đổi base URL

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

Cùng mô hình, giá chỉ bằng một phần nhỏ

So sánh giá mỗi triệu token với OpenRouter trên cùng một mô hình.

Mô hình OpenRouter cheaptokens Bạn tiết kiệm
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× rẻ hơn
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× rẻ hơn

Cùng các mô hình. Giá USD trên mỗi 1 triệu token (đầu vào / đầu ra). OpenRouter được hiển thị để so sánh. · Mở công cụ tính chi phí

FAQ

Hermes có kết nối qua OpenAI API không?

Có — hãy trỏ Hermes đến URL cơ sở và khóa tương thích với OpenAI của chúng tôi.

Các lượt chạy đa bước, có tính tác nhân (agentic) có được hỗ trợ không?

Có — việc sử dụng công cụ và quy trình làm việc đa bước được truyền qua mà không thay đổi.

Giá cả có được cố định trong suốt quá trình chạy không?

Có — giá tính theo USD cho mỗi mô hình, mỗi token và không thay đổi trong quá trình chạy.

Suy luận mô hình mã nguồn mở giá rẻ

Tạo tài khoản, nạp USDT và trỏ client của bạn về cheaptokens.

Bắt đầu ngay

Tên các mô hình mã nguồn mở là thương hiệu của chủ sở hữu tương ứng. Tương thích thông qua API tiêu chuẩn của OpenAI.