یادگیری ماشین یا machine learning به طور کلی به 3 دسته یادگیری نظارت شده، یادگیری بدون نظارت و یادگیری تقویتی تقسیم میشود. آشنایی با انواع یادگیری ماشین میتواند به درک و نحوه استفاده از رایانه کمک بسیار زیادی بکند.
برای مطالعه بیشتر در حوزه “یادگیری ماشین” و “هوش مصنوعی” میتوانید این مطالب را مطالعه کنید.
انواع یادگیری ماشین شامل 3 دسته یادگیری نظارت شده، یادگیری بدون نظارت و یادگیری تقویتی است.
- یادگیری تحت نظارت (نظارت شده)
- کاربردهای یادگیری تحت نظارت
- شناسایی تبلیغات پربازدید و محبوب
- طبقهبندی هرزنامهها
- شناسایی و تشخیص چهره
- یادگیری بدون نظارت
- کاربردهای یادگیری بدون نظارت
- سیستمهای پیشنهاد دهنده یا recommender systems
- بررسی رفتار مصرف کننده
- دسته بندی سوابق کاربران
- یادگیری تقویتی
- مهمترین الگوریتمهای یادگیری تقویتی
- کاربردهای یادگیری تقویتی
- بازیهای ویدئویی
- صنعت
- سیستمهای توصیهگر
- مدیریت منابع
- جمعبندی
- منابع
یادگیری تحت نظارت (نظارت شده) #
یادگیری نظارت شده یا Reinforcement Learning یکی از انواع یادگیری ماشین است. این روش بسیار ساده و قابل درک بوده و از این جهت محبوبترین روش برای یادگیری ماشین شناخته شده است.
یادگیری نظارت شده بسیار کاربردی و مانند آموزش به کودکان از طریق فلش کارت است. شما میتوانید با استفاده از دادههای وارد شده و در قالب مثالهایی با برچسب که نقش عنوان را دارد یک الگوریتم یادگیری را ایجاد کنید. درنتیجه با شرایط ایجاد شده، الگوریتم میتواند برای هر مثال برچسب مشخصی را پیشبینی کند و به آن بازخورد دهد که آیا پاسخ درست را پیشبینی کرده است یا خیر. این فرایند در ابتدا کمی زمانبر و پیچیده است اما با گذشت زمان الگوریتم به شناخت دقیقتری از رابطه بین نمونهها و برچسبهای آن پی برده و برای نمونه جدیدی که برای اولین بار با آن مواجه میشود، میتواند برچسب خوبی را پیشبینی کند.
از آنجاییکه یادگیری نظارت شده متمرکز بر یک کار منفرد است اغلب با عنوان یادگیری وظیفه محور از آن یاد میشود.
کاربردهای یادگیری تحت نظارت #
شناسایی تبلیغات پربازدید و محبوب
به احتمال زیاد برای شما هم پیش آمده است، زمانی که درحال گذراندن در فضای اینترنت هستید تبلیغاتی را به صورت رندوم مشاهده کردهاید.
درواقع الگوریتم یادگیری تحت نظارت آگهیهای مدنظر را از نظر میزان محبوبیت، عملکرد و تعداد کلیک سنجیده و آنها را برای نمایش به شما نشان میدهد.
طبقهبندی هرزنامهها
اگر دارای حساب کاربری ایمیل هستید ممکن است با فیلتر اسپم آشنا باشید؛ فیلتر اسپم به عنوان سیستم یادگیری نظارت شده ایمیلهای مخرب و آزاردهنده را فیلتر میکند. نکته بسیار جالب این است که بسیاری از موارد قابلیت اضافه کردن برچسب جدیدی را از طرف کاربر دارند که از طریق آن سیستم میتواند ترجیح کاربر را تشخیص دهد.
شناسایی و تشخیص چهره
از دیگر موارد استفاده از الگوریتم یادگیری تحت نظارت؛ کاربرد آن در سیستم تشخیص چهره است.
در یک نمونه بارز گوشیهای هوشمند اپل که امروزه طرفداران زیادی دارند دارای ویژگی تشخیص چهره به نام Face Id هستند. این سیستم چهرهها را پیدا میکند و با شناسایی کاربر اجازه ادامه کار را به او میدهد.
یادگیری بدون نظارت #
یادگیری بدون نظارت برخلاف یادگیری نظارت شده فاقد برچسب است. در این نوع از انواع یادگیری ماشین دادههای زیادی به الگوریتم داده شده و برای درک ویژگی این دادهها ابزار مخصوصی ارائه میشود.
در حالت یادگیری بدون نظارت، مدل به وسیله مشاهدات آموزش را فرا میگیرد و با استفاده از خوشهبندی، دستهبندی و سازماندهی دادهها ارتباطات و الگوهای موجود در آن را کشف میکند.
از آنجاییکه نتایج به دست آمده از یادگیری بدون نظارت را، دادهها و نحوه شکلگیری آنها کنترل میکند میتوان نتیجه گرفت که یادگیری بدون نظارت داده محور است.
در یک مثال ساده فرض کنید یک بانک اطلاعاتی بزرگ را در اختیار دارید که داخل آن تعداد بیشماری مقاله تحقیقاتی با موضوعات متفاوت وجود دارد و الگوریتمهای یادگیری بدون نظارت وظیفه دسته بندی و مرتب سازی آنها را براساس آخرین به روز رسانی دارند. حال اگر بخواهید خودتان 0 تا 100 یک پروژه تحقیقاتی را برعهده بگیرید و اقدام به نوشتن آن کنید، این الگوریتم میتواند موضوعات مرتبط به فعالیت شما را پیشنهاد دهد، بدون شک وجود چنین ابزاری باعث سرعت بخشیدن به کار شما و افزایش بهره وری خواهد شد.
کاربردهای یادگیری بدون نظارت #
سیستمهای پیشنهاد دهنده یا recommender systems
سعی میکند علایق کاربر را در وبسایت شناسایی و پیشبینی کند و آیتمهای مناسب با سلیقه او را انتخاب کند. این سیستمها اکثرا در دامنه یادگیری بدون نظارت قرار میگیرند. سایتهایی مانند یوتیوب و نتفلیکس از سیستم پیشنهاد دهنده استفاده میکنند تا روزانه لیستی براساس ژانر فیلم، تاریخچه تماشای کاربران قبلی و طول فیلم به کاربران خود ارائه دهند.
بررسی رفتار مصرف کننده
اگر احتمال دهیم که عادات خرید شما در جایی از پایگاه داده ذخیره شود، این عادات میتوانند رفتار مصرف کننده را بررسی کنند و از آن میتوان برای گروه بندی مشتریان در بخشهای خرید مشابه استفاده کرد. این روش در بازاریابی شرکتها بسیار موثر واقع شده است.
دسته بندی سوابق کاربران
یکی از کاربردهای مفید سیستم یادگیری بدون نظارت دسته بندی سوابق و مشکلات کاربران است. یک شرکت برای ایجاد پشتیبانی و حس مسئولیت نسبت به مشتریان خود میتواند از طریق سوالات متداول برای رسیدگی به مشکلات مشترک بین کاربران و بهبود محصولاتش استفاده کند که این موضوع به کمک الگوریتم یادگیری بدون نظارت امکان پذیر میباشد.
یادگیری تقویتی #
یادگیری تقویتی نیز یکی دیگر از انواع یادگیری ماشین است که نسبت به 2 مورد قبلی متفاوتتر بوده و از آن برای درک وجود یا عدم وجود برچسب استفاده میشود.
برای آسان سازی و درک مفهوم، بهتر است به مثال زیر توجه کنید. فرض کنید در یک شرکت، فردی به عنوان کارشناس فروش استخدام شده است که در ازای ورود هر مشتری از شرکت پورسانت دریافت میکند.
اگر کارمند را عامل (Agent) و محیط شرکت را (Environment) درنظر بگیریم، عامل در وضعیتی قرار دارد که با هر اقدام او ممکن است وضعیت موجود در شرکت تغییر کند و درنهایت عامل به پاداش مثبت یا منفی از کار خود برسد.
با این وجود عامل (کارشناس فروش) همواره در تلاش است تا اقداماتی را انجام دهد که به پاداش مثبت ختم شود. پس به طور خلاصه در یادگیری تقویتی یک عامل در محیط وجود دارد که با توجه به سیاست خود همواره در تلاش است تا پاداشهای دریافتی خود را به حداکثر برساند و از این جهت میتوان نتیجه گرفت یادگیری تقویتی؛ یادگیری مبتنی بر بازخورد است.
مهمترین الگوریتمهای یادگیری تقویتی #
برخی از مهمترین الگوریتمهای حوزه یادگیری تقویتی عبارت است از:
Q-Learning: یک الگوریتم بدون مدل (Model-free) و بدون سیاست (Off-policy) است.
SARSA: یک الگوریتم بدون مدل (Model-free) و مبتنی بر سیاست (On-policy) است.
Deep Q-network: الگوریتمی بدون مدل (Model-free) و بدون سیاست (Off-policy) است.
کاربردهای یادگیری تقویتی #
بازیهای ویدئویی
امروزه بازیها به همراه تکنولوژی پیشرفت میکنند و جزئی از صنعت پررونق هستند. هرچقدر یک بازی به دنیا واقعی نزدیکتر باشد نیاز دارد تا جزئیات بیشتری به آن اضافه شود.
از جمله الگوریتمهای یادگیری تقویتی مانند Alpha Go و Alpha Zer که برای بازیهایی مانند، شطرنج، shogi هستند به پیشرفت صنعت بازی کمک بیشماری کرده اند.
یادگیری تقویتی؛ یادگیری مبتنی بر بازخورد است.
صنعت
یکی از کاربردهای مفید یادگیری تقویتی در دنیای واقعی، استفاده از آن در خطوط مونتاژ است. این کار باعث شده ماشینها بدون نیاز به رمزگشایی مراحل کاری خود را طی کرده و از برق کمتری استفاده کنند که این امر کمک بسیار زیادی به کاهش هزینهها و صرفه جویی میکند.
سیستمهای توصیهگر
پلتفرمهایی رایج برای اخبار، موسیقی و فیلم (نتفلیکس) از سیستمهای پیشرفته توصیهگر برای اموری مانند اولویت بندی، نشان دادن فیلمهای پرطرفدار و ژانرهای مرتبط استفاده میکنند.
ما به عنوان کاربر در زندگی روزمره خود از طریق فضای سرگرمی و اطلاعاتی با این مدل روبه رو خواهیم شد.
مدیریت منابع
این نوع یادگیری میتواند باعث ایجاد تعادل در برخی شرایط شود. مراکز داده گوگل از این مدل برای براورد کردن نیازهای انرژی و حفظ تعادل استفاده میکنند که این امر باعث کاهش هزینهها و صرفه جویی اقتصادی میشود.
جمعبندی #
اگرچه تا امروز یادگیری ماشین توانسته است در بسیاری از موارد کاربرد داشته باشد اما در دنیا آینده این استفاده بیشتر خواهد شد تا جاییکه با پیشرفت بیشتر؛ راهها و شیوههای جدیدتری برای سرعت بخشیدن به یادگیری ماشین کشف خواهد شد.
بنابراین بهتر است خودمان برای شروع اصول یادگیری ماشین اقدام کنیم.
منابع #
اگر به اطلاعات بیشتری درباره انواع یادگیری ماشین نیاز دارید؛ شما می توانید با خواندن این مقاله تخصصی اطلاعات مفیدی را بدست آورید.