Abstract:
در این مقاله، یک ساختار افق نهایی متغیر برای مسئله کنترل بهینه تحت قیود حالت مطرح میکنیم، که در آن زمان نهایی از متغیر کنترل تحت شرایط مقید پیروی میکند. با تمرکز بر روی این مسئله کنترل بهینه جدید، یک اصل ماکزیمم سازی تصادفی جدید را بررسی میکنیم، که با مسئله کنترل بهینه مرسوم تحت محدودیتهای حالت متفاوت است. جفت بهینه ای از مدل کنترل بهینه را میتوان از طریق این اصل ماکزیمم سازی تصادفی جدید استخراج کرد.
Machine summary:
با تمرکز بر روي اين مسئله کنترل بهينه جديد، يک اصل ماکزيمم سازي تصادفي جديد را بررسي ميکنيم ، که با مسئله کنترل بهينه مرسوم تحت محدوديت هاي حالت متفاوت است .
واژه هاي کليدي: معادله ديفرانسيل تصادفي، اصل ماکزيمم سازي تصادفي، افق نهايي متغير ١- مقدمه در مسئله کنترل بهينه تصادفي مرسوم ، معمولاً مدل زير را در نظر ميگيريم .
تابع هزينه به شرح زير است : (1) که فرآيند حالت از معادله ديفرانسيل تصادفي کنترل شده زير پيروي ميکند: (2) ترکيب اصل ماکزيمم سازي تصادفي و اصل برنامه ريزي پويا دو ابزار قدرتمند براي مطالعه ي مسئله کنترل بهينه تصادفي مرسوم را تشکيل ميدهند.
ادامه اين مقاله به شرح زير است : در بخش ٢، يک مسئله ي کنترل بهينه تصادفي با زمان نهايي متغير را فرمول بندي ميکنيم .
فرض کنيد باشد، معادله ديفرانسيل تصادفي کنترل شده زير را در نظر بگيريد، (6) 557 با شرط اوليه ي ، که (U; ٠) ∋ (⋅)u يک فرآيند کنترل است که در يک مجموعه محدب از با عدد صحيح مثبت مقدار ميگيرد، و (U; ٠) مجموعه اي از Uهاي مقدارگرفته شده است و فرآيندهاي اندازه پذير سازگار با بطوريکه در اين مقاله ، تابع هزينه زمان نهايي متغير زير را در نظر ميگيريم : (رجوع شود به تصویر صفحه) داريم و براي .
علاوه بر اين ، اصل ماکزيمم سازي تصادفي را براي تابع هزينه ي با زمان نهايي متغير در قضيه ١ اثبات کرديم .