آموزش مساله Multi-Armed Bandit در یادگیری تقویتی با متلب (رایگان)
بررسی کامل دوره
توضیحات
سه روش اساسی برای یادگیری در هوش مصنوعی، یادگیری نظارتشده (Supervised)، نظارتنشده (Unsupervised) و تقویتی (Reinforcement) است. در یادگیری نظارتشده یک سری سیگنالهای لیبلدار وجود دارند و آنها را به عامل نشان میدهیم.
در یادگیری تقویتی نیز داده لیبلدار وجود ندارد ولی عامل از طریق تعامل با محیط تجربه کسب میکند و یاد میگیرد کارهایی را انجام دهد که منجر به دریافت بیشترین پاداش در آینده شود. یادگیری تقویتی در حقیقت روش محاسباتی برای یادگیری از طریق تجربه و تعامل با محیط و همواره در تلاش برای ماکزیمم کردن پاداشها در بلندمدت است. به بیان دیگر، یادگیری تقویتی یک نگاشت از موقعیت به عمل است، یعنی نشان میدهد در هر موقعیت یا حالتی چه عملی باید انجام شود تا به هدف برسیم.در این فرادرس به بررسی آموزش مسأله Multi-Armed Bandit در یادگیری تقویتی با متلب میپردازیم که شامل مسائل غیر ایستا، الگوریتم Constant-Alpha و مقادیر اولیه خوشبینانه میشود.
دوره آموزش مساله Multi-Armed Bandit در یادگیری تقویتی با متلب (رایگان) دورهای با امتیاز نهایی 3 میباشد و توسط دوره بین که موتور جستجوی بهترین دوره های آموزشی میباشد، تحلیل، بررسی و امتیازدهی شده است. مدت زمان این دوره 46 دقیقه میباشد که در فرادرس توسط امید زندی مدرس این دوره ارائه شده است. قابل توجه است که این دوره مدرک ندارد و دوره مذکور رایگان میباشد.
همچنین میتوانید با کلیک بر روی دکمه شروع یادگیری به آموزشگاه ارائهدهنده متصل شوید و دوره آموزش مساله Multi-Armed Bandit در یادگیری تقویتی با متلب (رایگان) را تهیه نمایید.
علاوه بر این، شما عزیزان میتوانید همه دورههای مشخص نشده سراسر اینترنت را در صفحه مشخص نشده در دورهبین مشاهده، مقایسه و بهترین دوره از نظر کیفیت و قیمت را به آسانی انتخاب نمایید.
دورههای مشابه
آموزش یادگیری تقویتی – Reinforcement Learning (رایگان)
دکتر امیر حسین کیهانی پور
فرادرس
آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی در ماشینلرنینگ
Andrew Ng
مکتب خونه
آموزش پیاده سازی بازی مار در پایتون با یادگیری تقویتی عمیق
سید علی کلامی هریس
فرادرس
آموزش حل مساله دیسپاچینگ اقتصادی با روش های کلاسیک در متلب (رایگان)
دکتر سید مصطفی کلامی هریس
فرادرس
نظرات فراگیران