ওপেন-ওয়েট মডেলের জন্য সাশ্রয়ী ইনফারেন্স

MiniMax, Kimi, GLM 5.2-এর মতো ওপেন-ওয়েট মডেলগুলো নির্দিষ্ট USD প্রতি-টোকেন রেটে চালান, একটি ড্রপ-ইন OpenAI-সামঞ্জস্যপূর্ণ এন্ডপয়েন্টের মাধ্যমে।

ওপেন-ওয়েট, সাশ্রয়ী মূল্য

খরচ-সাশ্রয়ী অবকাঠামোতে ওপেন-ওয়েট মডেলগুলো নির্দিষ্ট USD মার্জিনে ব্যবহার করুন — একই মডেলে OpenRouter-এর তুলনায় প্রতি টোকেনে প্রায় 10 গুণ কম খরচ। অনুমানযোগ্য, কোনো সাবস্ক্রিপশন নেই।

ড্রপ-ইন OpenAI-সামঞ্জস্যপূর্ণ

একই OpenAI API, একই ওপেন-ওয়েট মডেল — শুধু একটি ভিন্ন বেস URL এবং কি (key) ব্যবহার করুন। USDT দিয়ে টপ-আপ করা USD ব্যালেন্স থেকে পে-অ্যাজ-ইউ-গো পদ্ধতিতে পেমেন্ট করুন। কোনো কার্ড বা KYC-এর প্রয়োজন নেই।

ড্রপ-ইন: বেস URL পরিবর্তন করুন

env
# Open-weight, OpenAI-compatible
export OPENAI_BASE_URL="https://api.cheaptokens.dev/v1"
export OPENAI_API_KEY="YOUR_CHEAPTOKENS_KEY"

একই মডেল, অনেক কম খরচে

একই মডেলে OpenRouter-এর তুলনায় প্রতি মিলিয়ন টোকেনের রেট।

মডেল OpenRouter cheaptokens আপনি সাশ্রয় করছেন
MiniMax-M2.7 $0.24 / $0.96 $0.025 / $0.1 ~10× সাশ্রয়ী
Kimi-K2.6 $0.66 / $3.41 $0.07 / $0.35 ~9× সাশ্রয়ী

একই মডেল। প্রতি ১ মিলিয়ন টোকেনের জন্য USD (ইনপুট / আউটপুট)। তুলনার জন্য OpenRouter দেখানো হয়েছে। · খরচ ক্যালকুলেটর খুলুন

FAQ

Hermes কি OpenAI API-এর মাধ্যমে সংযোগ স্থাপন করে?

হ্যাঁ — Hermes-কে আমাদের OpenAI-সামঞ্জস্যপূর্ণ বেস URL এবং কী (key)-এর দিকে নির্দেশ করুন।

এজেন্টিক, মাল্টি-স্টেপ রান কি সমর্থিত?

হ্যাঁ — টুল ব্যবহার এবং মাল্টি-স্টেপ ওয়ার্কফ্লো অপরিবর্তিত থাকে।

রানের সময় কি মূল্য নির্ধারণ করা থাকে?

হ্যাঁ — প্রতি-মডেল, প্রতি-টোকেন USD যা রানের মাঝপথে পরিবর্তিত হয় না।

সাশ্রয়ী ওপেন-ওয়েট ইনফারেন্স

একটি অ্যাকাউন্ট তৈরি করুন, USDT দিয়ে টপ-আপ করুন এবং আপনার ক্লায়েন্টকে cheaptokens-এর দিকে নির্দেশ করুন।

শুরু করুন

ওপেন-ওয়েট মডেলের নামগুলো তাদের নিজ নিজ মালিকদের ট্রেডমার্ক। স্ট্যান্ডার্ড OpenAI API-এর মাধ্যমে সামঞ্জস্যপূর্ণ।