مقدمهای بر انواع یادگیری ماشینی
مقاله زیر یک طرح کلی برای انواع یادگیری ماشینی فراهم میکند. یادگیری ماشینی شاخهای از هوش مصنوعی است که بر توسعه برنامههای کامپیوتری تمرکز دارد که با ارائه یک سیستم با توانایی یادگیری و اصلاح خودکار، به دادهها دسترسی دارند.
به عنوان مثال، یافتن الگوها در پایگاه داده بدون هیچ گونه دخالت انسانی بر اساس نوع داده، یعنی برچسبدار یا بدون برچسب و بر اساس تکنیکهای مورد استفاده برای آموزش مدل بر روی یک مجموعه داده، انجام میشود. یادگیری ماشینی بیشتر به عنوان الگوریتمهای یادگیری نظارتی، بدون نظارت، تقویتی و نیمه نظارت طبقه بندی میشود. همه این نوع تکنیکهای یادگیری در کاربردهای مختلف مورد استفاده قرار میگیرند.
یادگیری ماشینی چیست؟
یادگیری ماشینی یک مبحث کاربردی کوچک، از هوش مصنوعی است که در آن ماشینها به طور خودکار از عملیاتها یاد میگیرند و مهارت خود را بالا میبرند تا خروجی بهتری داشته باشند. بر اساس دادههای جمعآوریشده، ماشینها برنامههای کامپیوتری را با خروجی مورد نیاز هماهنگ میکنند. برای اینکه یک ماشین به تنهایی این توانایی را به دست بیاورد، برنامهنویسی صریحی برای این رایانهها نیاز نیست.
با این حال، بدون اینکه ما متوجه شویم ماشینها در همه جای زندگی ما نفوذ کردهاند. تقریباً هر ماشین که ما استفاده میکنیم و ماشینهای فناوری پیشرفتهای که در دهه گذشته شاهد آن بودیم، یادگیری ماشینی را برای افزایش کیفیت محصولات در خود جای داده است. برخی از نمونههای یادگیری ماشینی عبارتند از: اتومبیلهای خودران، جستجوهای پیشرفته وب، بازشناسی گفتار.
تفاوت بین برنامهنویسی متداول و یادگیری ماشینی
برنامهنویسی متداول= منطق برنامه ریزی شدهاست + دادهها وارد میشود + منطق روی داده اجرا میشود + خروجی
یادگیری ماشینی = دادهها وارد میشود + خروجی مورد انتظار وارد میشود + برای آموزش الگوریتم از ورودی به خروجی آن را روی ماشین اجرا کنید. مختصر، اجازه دهید منطق راه خود را برای رسیدن از ورودی به خروجی ایجاد کند + الگوریتم آموزش برای پیش بینی دادههای آزمایشی مورد استفاده قرار گرفت .
روش های یادگیری ماشینی
ما بر اساس نوع یادگیری که از الگوریتمها انتظار داریم، چهار نوع اصلی روش یادگیری ماشینی داریم:
1.یادگیری ماشینی نظارتی (یادگیری وظیفه محور)
الگوریتمهای یادگیری نظارتی زمانی استفاده میشوند که خروجی طبقهبندی یا برچسبگذاری شود. این الگوریتمها از دادههایی که از قبل وارد میشوند، به عنوان دادههای آموزشی استفاده میکنند، تحلیل خود را اجرا و از این تحلیل برای پیشبینی رویدادهای آینده هر داده جدید، در طبقهبندیهای شناخته شده استفاده میکنند. پیشبینی دقیق دادههای آزمون به دادههای بزرگ نیاز دارد تا درک کافی از الگوها داشته باشیم. الگوریتم را می توان با مقایسه خروجیهای آموزشی با خروجیهای واقعی و استفاده از خطاها برای اصلاح الگوریتمها آموزش داد.
مثالهای استفاده از آن در زندگی واقعی:
طبقهبندی تصویر – الگوریتم از دادههای تصویر برچسبدار تقویت میشود. یک الگوریتم آموزش داده شده و انتظار می رود که با توجه به الگوریتم تصویر جدید را به درستی طبقه بندی کند.
پیشبینی وضعیت بازار – به آن رگرسیون نیز میگویند. دادههای گذشته بازار تجاری به رایانه داده میشود. سپس با تحلیل و الگوریتم رگرسیون، قیمت جدید محصول در آینده بسته به متغیرها پیشبینی میشود.
-
یادگیری ماشینی بدون نظارت
الگوریتمهای یادگیری بدون نظارت زمانی مورد استفاده قرار میگیرند که از خروجیهای نهایی غافل هستیم, و طبقهبندی و یا خروجیهای برچسب گذاری در اختیار ما نیستند. این الگوریتمها به مطالعه و تولید یک تابع برای توصیف کامل الگوهای پنهان و بدون برچسب میپردازند. بنابراین هیچ خروجی صحیحی وجود ندارد, اما دادهها را مطالعه میکند تا ساختارهای ناشناخته را در دادههای بدون برچسب نشان دهد.
انواع یادگیری ماشینی
مثالهای استفاده از آن در زندگی واقعی:
دستهبندی – الگوریتم از دادههای دارای صفات مشابه درخواست میکند تا به کمک آن در یک گروه قرار بگیرند. این گروه دستهبندی نامیده میشود. این دادهها به منظور بررسی این گروهها مفید هستند، که میتوانند کم و بیش برای کل دادههای یک دسته اعمال شوند.
دادههایی با ابعاد بالا – معمولاً کار با دادههای با ابعاد بالا آسان نیست. با کمک یادگیری بدون نظارت، تجسم دادههایی با ابعاد بالا امکان پذیر میشود.
مدلهای سازنده– زمانی که الگوریتم شما تجزیه و تحلیل میکند و توزیع احتمال ورودی را به دست میآورد، میتوان از آن برای تولید دادههای جدید استفاده کرد. این ثابت میکند که در مواردی که دادهها از دست میروند میتواند مفید باشد.
-
یادگیری تقویتی
این نوع الگوریتم یادگیری ماشینی از روش آزمون و خطا برای تولید خروجی بر اساس بالاترین بازده تابع استفاده میکند. این الگوریتم به دنبال پاداشهای مثبت میباشد و وقتی الگوریتم یک اقدام مثبت در راستای رسیدن به هدف انجام بدهد پاداش دریافت میکند. همچنین الگوریتم باید تلاش کند تا از مجازاتهای تعیین شده جلوگیری شود. این مجازاتها وقتی که الگوریتم با اقدامی از مسیر رسیدن به هدف دورتر میشود اتفاق میافتد.
4 .یادگیری ماشینی به صورت نیمه نظارتی
این الگوریتمها معمولاً دادههای برچسبدار و بدون برچسب را در برمیگیرند، که در آن مقدار دادههای بدون برچسب در مقایسه با دادههای برچسبدار بیشتر است. از آنجایی که با هر دو الگوریتم یادگیری نظارتی و بدون نظارت کار میکند، بنابراین یادگیری ماشینی نیمه نظارتی نامیده میشود. سیستمهایی که از این مدلها استفاده میکنند، دقت یادگیری را بهبود میبخشند.
مثال – یک آرشیو عکس فقط میتواند حاوی برخی از دادههای برچسب گذاری شده خود باشد، به عنوان مثال. سگ، گربه، موش و تعداد زیادی از تصاویر بدون برچسب باقی میمانند.
مدلهای مبتنی بر نوع خروجی از الگوریتمها
در زیر انواع مدلهای یادگیری ماشینی بر اساس نوع خروجیهایی که از الگوریتمها انتظار داریم آورده شده است:
1.طبقهبندی
یک تقسیم بندی از دستههای ورودی وجود دارد. سیستم، یک مدل از دادههای آموزشی تولید میکند که در آن ورودیهای جدید را به یکی از این دستهها اختصاص میدهد.تحت پوشش یادگیری نظارتی قرار میگیرد. یک مثال واقعی می تواند فیلتر کردن اسپم باشد، که در آن ایمیلها ورودیهایی هستند که به عنوان “اسپم” یا “غیر اسپم” طبقهبندی میشوند.
-
رگرسیون
الگوریتم رگرسیون نیز بخشی از یادگیری نظارت شدهاست، اما تفاوت آن در این است که خروجیها متغیرهای پیوسته هستند و گسسته نیستند.
مثال – پیشبینی قیمت مسکن با استفاده از دادههای گذشته.
-
کاهش بُعد
این نوع یادگیری ماشینی به تجزیه و تحلیل ورودیها مربوط میشود و آنها را به موارد مرتبط برای توسعه مدل کاهش میدهد. انتخاب ویژگی، یعنی انتخاب ورودی و استخراج ویژگی، موضوعات دیگری است که برای درک بهتر کاهش بُعد مورد نیاز است.
بر اساس رویکردهای مختلف فوق، الگوریتمهای مختلفی وجود دارد که باید در نظر گرفتهشوند. برخی از الگوریتمهای بسیار رایج عبارتند از: رگرسیون خطی و لجستیک، k-نزدیکترین همسایه، درخت تصمیم، ماشینهای بردار پشتیبانی، جنگل تصادفی و غیره. با کمک این الگوریتمها, مشکلات تصمیمگیری برای حل موارد پیچیده میتوانند یک جهت مشخص براساس مقدار بسیار زیادی از دادهها داشته باشند. برای دستیابی به درستی دادهها و انواع موقعیتها، باید منابع اضافی و همچنین زمان فراهم شود. بنابراین، یادگیری ماشینی که در کنار هوش مصنوعی و سایر فناوریها استفاده میشود، برای پردازش اطلاعات مؤثرتر است.
انواع یادگیری ماشینی
مطالعات بیشتر: