بهینه سازی عملکرد مدل ها
بخش بهینهسازی عملکرد این امکان را به شما میدهد که ترجیحات کلی خود را در استفاده از مدلهای هوش مصنوعی مشخص کنید. از آنجا که مدلها توسط چندین ارائهدهنده (Provider) مختلف عرضه میشوند، تفاوتهایی میان آنها از نظر قیمت، سرعت پاسخگویی، و ظرفیت پردازشی وجود دارد.
در نظر داشته باشید که شما نمیتوانید مستقیماً ارائهدهنده را انتخاب کنید، اما میتوانید با تنظیم این بخش، اولویت کلی خود را مشخص نمایید.
برای انتخاب نوع عملکرد، تنها کافیست تا وارد پروژه هوش مصنوعی خود شوید و در قسمت تنظیمات، از بخش بهینهسازی عملکرد، گزینه مدنظر خود را انتخاب کنید.

سه گزینهی اصلی برای بهینهسازی عملکرد وجود دارد که در ادامه به توضیح هر گزینه، پرداخته شده است.
قیمت پایینتر
در این حالت سیستم تلاش میکند از ارائهدهندههایی استفاده کند که هزینه کمتری دارند. اگر ارائهدهندهی ارزانتر در دسترس نباشد، سیستم بهطور خودکار به ارائهدهندههای دیگر تغییر میکند. این گزینه مناسب برای کاربرانی است که هزینه پایینتر را نسبت به سرعت یا ظرفیت در اولویت قرار میدهند.
تعداد درخواست همزمان بالاتر
وقتی شما از یک مدل هوش مصنوعی استفاده میکنید، هر بار که پیامی میفرستید یا پردازشی انجام میدهید، یک درخواست (Request) به سیستم ارسال میشود. اگر فقط یک کاربر یا سرویس در لحظه از مدل استفاده کند، معمولاً همهچیز سریع و روان اجرا میشود. اما در بعضی پروژهها (مثلاً یک ربات تلگرام یا اپلیکیشن با تعداد زیادی کاربر همزمان)، ممکن است دهها یا حتی صدها درخواست در یک لحظه ارسال شوند.
برخی ارائهدهندگان، ظرفیتِ پردازش تعداد بیشتری درخواست همزمان دارند. اگر پروژهی شما نیاز به ارسال تعداد زیادی درخواست همزمان داشته باشد، این گزینه بهترین انتخاب است.
سرعت پاسخگویی بالاتر
اگر شما این گزینه را فعال کنید؛ در این حالت، سیستم ارائهدهندههایی را انتخاب میکند که سریعتر پاسخ میدهند، حتی اگر قیمت آنها بالاتر باشد. این گزینه مناسب برای پروژههایی است که زمان پاسخ در آن، اهمیت زیادی دارد (مثلاً چتباتهای زنده یا سرویسهای Real-Time).
نکات قابل توجه
- بهصورت مستقیم، امکان مشاهده ارائهدهنده نهایی برای شما وجود ندارد
- قیمتهایی که در بخش مدلها نمایش داده میشوند بر اساس ارزانترین ارائهدهنده درج شدهاند
- در صورتی که شما گزینههای سرعت بالاتر یا تعداد درخواست همزمان بیشتر را انتخاب کنید، ممکن است هزینهی نهایی کمی بیشتر از جدول باشد
- هزینهی دقیق محاسبهشده در بخش لاگها قابل مشاهده است
مثال
فرض کنید که از مدل gpt-4o-mini استفاده میکنید و گزینهی قیمت پایینتر را انتخاب کردهاید. در این حالت:
- سیستم به احتمال زیاد از ارائهدهندهای مثل Azure استفاده میکند چون هزینه کمتری دارد
- اگر Azure در دسترس نباشد، بهصورت خودکار از OpenAI یا سایر ارائهدهندگان استفاده میشود
اگر گزینهی سرعت پاسخگویی بالاتر را انتخاب کنید:
- ممکن است سیستم همان مدل را از ارائهدهندهای انتخاب کند که گرانتر است اما پاسخ سریعتری ارائه میدهد