بهینه سازی عملکرد مدل ها

بخش بهینه‌سازی عملکرد این امکان را به شما می‌دهد که ترجیحات کلی خود را در استفاده از مدل‌های هوش مصنوعی مشخص کنید. از آنجا که مدل‌ها توسط چندین ارائه‌دهنده (Provider) مختلف عرضه می‌شوند، تفاوت‌هایی میان آنها از نظر قیمت، سرعت پاسخگویی، و ظرفیت پردازشی وجود دارد.

در نظر داشته باشید که شما نمی‌توانید مستقیماً ارائه‌دهنده را انتخاب کنید، اما می‌توانید با تنظیم این بخش، اولویت کلی خود را مشخص نمایید.

برای انتخاب نوع عملکرد، تنها کافیست تا وارد پروژه هوش مصنوعی خود شوید و در قسمت تنظیمات، از بخش بهینه‌سازی عملکرد، گزینه مدنظر خود را انتخاب کنید.

performance optimization option in Liara Console

سه گزینه‌ی اصلی برای بهینه‌سازی عملکرد وجود دارد که در ادامه به توضیح هر گزینه، پرداخته شده است.

قیمت پایین‌تر

در این حالت سیستم تلاش می‌کند از ارائه‌دهنده‌هایی استفاده کند که هزینه کمتری دارند. اگر ارائه‌دهنده‌ی ارزان‌تر در دسترس نباشد، سیستم به‌طور خودکار به ارائه‌دهنده‌های دیگر تغییر می‌کند. این گزینه مناسب برای کاربرانی است که هزینه پایین‌تر را نسبت به سرعت یا ظرفیت در اولویت قرار می‌دهند.

تعداد درخواست همزمان بالاتر

وقتی شما از یک مدل هوش مصنوعی استفاده می‌کنید، هر بار که پیامی می‌فرستید یا پردازشی انجام می‌دهید، یک درخواست (Request) به سیستم ارسال می‌شود. اگر فقط یک کاربر یا سرویس در لحظه از مدل استفاده کند، معمولاً همه‌چیز سریع و روان اجرا می‌شود. اما در بعضی پروژه‌ها (مثلاً یک ربات تلگرام یا اپلیکیشن با تعداد زیادی کاربر همزمان)، ممکن است ده‌ها یا حتی صدها درخواست در یک لحظه ارسال شوند.

برخی ارائه‌دهندگان، ظرفیتِ پردازش تعداد بیشتری درخواست همزمان دارند. اگر پروژه‌ی شما نیاز به ارسال تعداد زیادی درخواست همزمان داشته باشد، این گزینه بهترین انتخاب است.

سرعت پاسخگویی بالاتر

اگر شما این گزینه را فعال کنید؛ در این حالت، سیستم ارائه‌دهنده‌هایی را انتخاب می‌کند که سریع‌تر پاسخ می‌دهند، حتی اگر قیمت آن‌ها بالاتر باشد. این گزینه مناسب برای پروژه‌هایی است که زمان پاسخ در آن، اهمیت زیادی دارد (مثلاً چت‌بات‌های زنده یا سرویس‌های Real-Time).

نکات قابل توجه

به‌صورت مستقیم، امکان مشاهده ارائه‌دهنده نهایی برای شما وجود ندارد
قیمت‌هایی که در بخش مدل‌ها نمایش داده می‌شوند بر اساس ارزان‌ترین ارائه‌دهنده درج شده‌اند
در صورتی که شما گزینه‌های سرعت بالاتر یا تعداد درخواست همزمان بیشتر را انتخاب کنید، ممکن است هزینه‌ی نهایی کمی بیشتر از جدول باشد
هزینه‌ی دقیق محاسبه‌شده در بخش لاگ‌ها قابل مشاهده است

مثال

فرض کنید که از مدل gpt-4o-mini استفاده می‌کنید و گزینه‌ی قیمت پایین‌تر را انتخاب کرده‌اید. در این حالت:

سیستم به احتمال زیاد از ارائه‌دهنده‌ای مثل Azure استفاده می‌کند چون هزینه کمتری دارد
اگر Azure در دسترس نباشد، به‌صورت خودکار از OpenAI یا سایر ارائه‌دهندگان استفاده می‌شود

اگر گزینه‌ی سرعت پاسخگویی بالاتر را انتخاب کنید:

ممکن است سیستم همان مدل را از ارائه‌دهنده‌ای انتخاب کند که گران‌تر است اما پاسخ سریع‌تری ارائه می‌دهد