انواع یادگیری ماشین

انواع یادگیری ماشین

یادگیری ماشین یا machine learning به طور کلی به 3 دسته یادگیری نظارت شده، یادگیری بدون نظارت و یادگیری تقویتی تقسیم می‌شود. آشنایی با انواع یادگیری ماشین می‌تواند به درک و نحوه استفاده از رایانه کمک بسیار زیادی بکند.

برای مطالعه بیشتر در حوزه “یادگیری ماشین” و “هوش مصنوعی” می‌توانید این مطالب را مطالعه کنید.

هوش مصنوعی چیست؟ تعریف و مفاهیم

یادگیری ماشین چیست؟ انواع یادگیری ماشین و تعریف آن

انواع یادگیری ماشین شامل 3 دسته یادگیری نظارت شده، یادگیری بدون نظارت و یادگیری تقویتی است.

انواع یادگیری ماشین

یادگیری تحت نظارت (نظارت شده) #

یادگیری نظارت شده یا Reinforcement Learning یکی از انواع یادگیری ماشین است. این روش بسیار ساده و قابل درک بوده و از این جهت محبوب‌ترین روش برای یادگیری ماشین شناخته شده است.

یادگیری نظارت شده بسیار کاربردی و مانند آموزش به کودکان از طریق فلش کارت است. شما می‌توانید با استفاده از داده‌های وارد شده و در قالب مثال‌هایی با برچسب که نقش عنوان را دارد یک الگوریتم یادگیری را ایجاد کنید. درنتیجه با شرایط ایجاد شده، الگوریتم می‌تواند برای هر مثال برچسب مشخصی را پیش‌بینی کند و به آن بازخورد دهد که آیا پاسخ درست را پیش‌بینی کرده است یا خیر. این فرایند در ابتدا کمی زمان‌بر و پیچیده است اما با گذشت زمان الگوریتم به شناخت دقیق‌تری از رابطه بین نمونه‌ها و برچسب‌های آن پی برده و برای نمونه جدیدی که برای اولین بار با آن مواجه می‌شود، می‌تواند برچسب خوبی را پیش‌بینی کند.

از آن‌جایی‌که یادگیری نظارت شده متمرکز بر یک کار منفرد است اغلب با عنوان یادگیری وظیفه محور از آن یاد می‌شود.

کاربردهای یادگیری تحت نظارت #

شناسایی تبلیغات پربازدید و محبوب

به احتمال زیاد برای شما هم پیش آمده است، زمانی که درحال گذراندن در فضای اینترنت هستید تبلیغاتی را به صورت رندوم مشاهده کرده‌اید.

درواقع الگوریتم یادگیری تحت نظارت آگهی‌های مدنظر را از نظر میزان محبوبیت، عملکرد و تعداد کلیک سنجیده و آن‌ها را برای نمایش به شما نشان می‌دهد.

یادگیری نظارت شده

طبقه‌بندی هرزنامه‌ها

اگر دارای حساب کاربری ایمیل هستید ممکن است با فیلتر اسپم آشنا باشید؛ فیلتر اسپم به عنوان سیستم یادگیری نظارت شده ایمیل‌های مخرب و آزاردهنده را فیلتر می‌کند. نکته بسیار جالب این است که بسیاری از موارد قابلیت اضافه کردن برچسب جدیدی را از طرف کاربر دارند که از طریق آن سیستم می‌تواند ترجیح کاربر را تشخیص دهد.

شناسایی و تشخیص چهره

از دیگر موارد استفاده از الگوریتم یادگیری تحت نظارت؛ کاربرد آن در سیستم تشخیص چهره است.

در یک نمونه بارز گوشی‌های هوشمند اپل که امروزه طرفداران زیادی دارند دارای ویژگی تشخیص چهره به نام Face Id هستند. این سیستم چهره‌ها را پیدا می‌کند و با شناسایی کاربر اجازه ادامه کار را به او می‌دهد.

یادگیری بدون نظارت #

یادگیری بدون نظارت برخلاف یادگیری نظارت شده فاقد برچسب است. در این نوع از انواع یادگیری ماشین داده‌های زیادی به الگوریتم داده شده و برای درک ویژگی این داده‌ها ابزار مخصوصی ارائه می‌شود.

در حالت یادگیری بدون نظارت، مدل به وسیله مشاهدات آموزش را فرا می‌گیرد و با استفاده از خوشه‌بندی، دسته‌بندی و سازماندهی داده‌ها ارتباطات و الگوهای موجود در آن را کشف می‌کند.

از آن‌جایی‌که نتایج به دست آمده از یادگیری بدون نظارت را، داده‌ها و نحوه شکل‌گیری آن‌ها کنترل می‌کند می‌توان نتیجه گرفت که یادگیری بدون نظارت داده محور است.

در یک مثال ساده فرض کنید یک بانک اطلاعاتی بزرگ را در اختیار دارید که داخل آن تعداد بی‌شماری مقاله تحقیقاتی با موضوعات متفاوت وجود دارد و الگوریتم‌های یادگیری بدون نظارت وظیفه دسته بندی و مرتب سازی آن‌ها را براساس آخرین به روز رسانی دارند. حال اگر بخواهید خودتان 0 تا 100 یک پروژه تحقیقاتی را برعهده بگیرید و اقدام به نوشتن آن کنید، این الگوریتم می‌تواند موضوعات مرتبط به فعالیت شما را پیشنهاد دهد، بدون شک وجود چنین ابزاری باعث سرعت بخشیدن به کار شما و افزایش بهره ‌وری خواهد شد.

یادگیری بدون نظارت

کاربردهای یادگیری بدون نظارت #

سیستم‌های پیشنهاد دهنده یا recommender systems

سعی می‌کند علایق کاربر را در وب‌سایت شناسایی و پیش‌بینی کند و آیتم‌های مناسب با سلیقه او را انتخاب کند. این سیستم‌ها اکثرا در دامنه یادگیری بدون نظارت قرار می‌گیرند. سایت‌هایی مانند یوتیوب و نتفلیکس از سیستم پیشنهاد دهنده استفاده می‌کنند تا روزانه لیستی براساس ژانر فیلم، تاریخچه تماشای کاربران قبلی و طول فیلم به کاربران خود ارائه دهند.

بررسی رفتار مصرف کننده

اگر احتمال دهیم که عادات خرید شما در جایی از پایگاه داده ذخیره شود، این عادات می‌توانند رفتار مصرف کننده را بررسی کنند و از آن می‌توان برای گروه ‌بندی مشتریان در بخش‌های خرید مشابه استفاده کرد. این روش در بازاریابی شرکت‌ها بسیار موثر واقع شده است.

دسته بندی سوابق کاربران

یکی از کاربردهای مفید سیستم یادگیری بدون نظارت دسته بندی سوابق و مشکلات کاربران است. یک شرکت برای ایجاد پشتیبانی و حس مسئولیت نسبت به مشتریان خود می‌تواند از طریق سوالات متداول برای رسیدگی به مشکلات مشترک بین کاربران و بهبود محصولاتش استفاده کند که این موضوع به کمک الگوریتم یادگیری بدون نظارت امکان پذیر می‌باشد.

یادگیری تقویتی #

یادگیری تقویتی نیز یکی دیگر از انواع یادگیری ماشین است که نسبت به 2 مورد قبلی متفاوت‌تر بوده و از آن برای درک وجود یا عدم وجود برچسب استفاده می‌شود.

برای آسان سازی و درک مفهوم، بهتر است به مثال زیر توجه کنید. فرض کنید در یک شرکت، فردی به عنوان کارشناس فروش استخدام شده است که در ازای ورود هر مشتری از شرکت پورسانت دریافت می‌کند.

اگر کارمند را عامل (Agent) و محیط شرکت را (Environment) درنظر بگیریم، عامل در وضعیتی قرار دارد که با هر اقدام او ممکن است وضعیت موجود در شرکت تغییر کند و درنهایت عامل به پاداش مثبت یا منفی از کار خود برسد.

با این وجود عامل (کارشناس فروش) همواره در تلاش است تا اقداماتی را انجام دهد که به پاداش مثبت ختم شود. پس به طور خلاصه در یادگیری تقویتی یک عامل در محیط وجود دارد که با توجه به سیاست خود همواره در تلاش است تا پاداش‌های دریافتی خود را به حداکثر برساند و از این جهت می‌توان نتیجه گرفت یادگیری تقویتی؛ یادگیری مبتنی بر بازخورد است.

یادگیری تقویتی

مهم‌ترین الگوریتم‌های یادگیری تقویتی #

برخی از مهم‌ترین الگوریتم‌های حوزه یادگیری تقویتی عبارت است از:

Q-Learning: یک الگوریتم بدون مدل (Model-free) و بدون سیاست (Off-policy) است.

SARSA: یک الگوریتم بدون مدل (Model-free) و مبتنی بر سیاست (On-policy) است.

Deep Q-network: الگوریتمی بدون مدل (Model-free) و بدون سیاست (Off-policy) است.

کاربردهای یادگیری تقویتی #

بازی‌‌های ویدئویی

امروزه بازی‌ها به همراه تکنولوژی پیشرفت می‌کنند و جزئی از صنعت پررونق هستند. هرچقدر یک بازی به دنیا واقعی نزدیک‌تر باشد نیاز دارد تا جزئیات بیشتری به آن اضافه شود.

از جمله الگوریتم‌های یادگیری تقویتی مانند Alpha Go و Alpha Zer که برای بازی‌هایی مانند، شطرنج، shogi هستند به پیشرفت صنعت بازی کمک بی‌شماری کرده اند.

یادگیری تقویتی؛ یادگیری مبتنی بر بازخورد است.

صنعت

یکی از کاربردهای مفید یادگیری تقویتی در دنیای واقعی، استفاده از آن در خطوط مونتاژ است. این کار باعث شده ماشین‌ها بدون نیاز به رمزگشایی مراحل کاری خود را طی کرده و از برق کمتری استفاده کنند که این امر کمک بسیار زیادی به کاهش هزینه‌ها و صرفه جویی می‌کند.

سیستم‌های توصیه‌گر

پلتفرم‌هایی رایج برای اخبار، موسیقی و فیلم (نتفلیکس) از سیستم‌های پیشرفته توصیه‌گر برای اموری مانند اولویت بندی، نشان دادن فیلم‌های پرطرفدار و ژانرهای مرتبط استفاده می‌کنند.

ما به عنوان کاربر در زندگی روزمره خود از طریق فضای سرگرمی و اطلاعاتی با این مدل روبه رو خواهیم شد.

مدیریت منابع

این نوع یادگیری می‌تواند باعث ایجاد تعادل در برخی شرایط شود. مراکز داده گوگل از این مدل برای براورد کردن نیازهای انرژی و حفظ تعادل استفاده می‌کنند که این امر باعث کاهش هزینه‌ها و صرفه جویی اقتصادی می‌شود.

جمع‌بندی #

اگرچه تا امروز یادگیری ماشین توانسته است در بسیاری از موارد کاربرد داشته باشد اما در دنیا آینده این استفاده بیشتر خواهد شد تا جایی‌که با پیشرفت بیشتر؛ راه‌ها و شیوه‌های جدیدتری برای سرعت بخشیدن به یادگیری ماشین کشف خواهد شد.

بنابراین بهتر است خودمان برای شروع اصول یادگیری ماشین اقدام کنیم.

منابع #

اگر به اطلاعات بیشتری درباره انواع یادگیری ماشین نیاز دارید؛ شما می ­توانید با خواندن این مقاله تخصصی اطلاعات مفیدی را بدست آورید.

https://www.javatpoint.com/types-of-machine-learning

لینک کوتاه این مقاله:
نیلوفر افشار
نیلوفر افشار

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *