اطلاعات دوره
مسیر یادگیری اختصاصی برای تو !
آموزش توابع احتمال MDP، بازگشت و دوره در یادگیری تقویتی با متلب (رایگان)
مسیر آموزشی

آموزش توابع احتمال MDP، بازگشت و دوره در یادگیری تقویتی با متلب (رایگان)

رایگان

بررسی کامل دوره

ranking course dorebin logo3/5
وضعیت قیمت: رایگان
بالاتر از انتظار
منصفانه
ارزان
  • نظرات :0 نظر0
  • آموزشگاه:فرادرس3.8
  • مدرس:امید زندی5
  • زمان:34 دقیقه
  • مدرک:ندارد
  • توضیحات:دارد

توضیحات

سه روش اساسی برای یادگیری در هوش مصنوعی، یادگیری نظارت‌‌‌شده (Supervised)، نظارت‌‌‌نشده (Unsupervised) و تقویتی (Reinforcement) است. در یادگیری نظارت‌‌شده یک سری سیگنال‌های لیبل‌دار وجود دارند و آن‌ها را به عامل نشان می‌دهیم.در یادگیری تقویتی نیز داده لیبل‌دار وجود ندارد ولی عامل از طریق تعامل با محیط تجربه کسب می‌کند و یاد می‌گیرد کارهایی را انجام دهد که منجر به دریافت بیشترین پاداش در آینده شود. یادگیری تقویتی در حقیقت روش محاسباتی برای یادگیری از طریق تجربه و تعامل با محیط و همواره در تلاش برای ماکزیمم‌ کردن پاداش‌ها در بلندمدت است. به بیان دیگر، یادگیری تقویتی یک نگاشت از موقعیت به عمل است، یعنی نشان می‌دهد در هر موقعیت یا حالتی چه عملی باید انجام شود تا به هدف برسیم.در این فرادرس به بررسی آموزش توابع احتمال MDP، بازگشت (Return) و دوره (Episode) در یادگیری تقویتی با متلب می پردازیم.
دوره آموزش توابع احتمال MDP، بازگشت و دوره در یادگیری تقویتی با متلب (رایگان) دوره‌ای با امتیاز نهایی 3 می‌باشد و توسط دوره بین که موتور جستجوی بهترین دوره‌ های آموزشی می‌باشد، تحلیل، بررسی و امتیازدهی شده است. مدت زمان این دوره 34 دقیقه می‌باشد که در فرادرس توسط امید زندی مدرس این دوره ارائه شده است. قابل توجه است که این دوره مدرک ندارد و دوره مذکور رایگان می‌باشد.
همچنین می‌توانید با کلیک بر روی دکمه شروع یادگیری به آموزشگاه ارائه‌دهنده متصل شوید و دوره آموزش توابع احتمال MDP، بازگشت و دوره در یادگیری تقویتی با متلب (رایگان) را تهیه نمایید.
علاوه بر این، شما عزیزان می‌توانید همه دوره‌های مشخص نشده سراسر اینترنت را در صفحه مشخص نشده در دوره‌بین مشاهده، مقایسه و بهترین دوره از نظر کیفیت و قیمت را به آسانی انتخاب نمایید.

نمایش بیشتر

نظرات فراگیران

دوره‌های مشابه

مطالب دوست‌داشتنی