تعریف بِیز ساده در یادگیری ماشینی:
بیز ساده در یادگیری ماشین به عنوان مدل احتمالی در تکنیک یادگیری ماشین، در ژانر یادگیری نظارت شده تعریف می شود، که در موارد استفاده طبقهبندی متنوع عمدتاً استفاده می شود، اما برای پسرفت (البته با تناسب اجباری!) نیز قابل استفاده است.
دلیل قرار دادن “ساده” در مقابل نام این الگوریتم به این دلیل است که فرض میکند ویژگیهایی که وارد مدل میشوند، مستقل از یکدیگر هستند یا به عبارت دیگر، تغییرات انجام شده در یک متغیر بر روی متغیرهای دیگر تأثیر نمیگذارد. این یک فرضیه قوی است و یک فرض اساسی است و تأثیر متغیر، قطعا موجود است. با توجه به این الگوریتم، اثر متغیر وجود دارد.
با توجه به این الگوریتم، بِیز ساده یک الگوریتم ساده و در عین حال بسیار قدرتمند است. به دلیل پیچیدگی کمتر، این گزینه برای هر یک از الگوریتمهایی است که در آن باید به سرعت به یک درخواست پاسخ داد یا برای ارائه بینشهای اساسی و در عین حال قدرتمند از دادهها، باید محاسباتی انجام داد!
الگوریتم “بِیز ساده” چگونه در یادگیری ماشین کار میکند؟
در مقدمه فهمیدیم که “بِیز ساده” یک الگوریتم ساده است که فرض می کند عواملی که بخشی از تجزیه و تحلیل هستند مستقل از یکدیگر هستند. اما کلمه دیگر “بِیز” چه می شود. برای اینکه درک عمیق تری از الگوریتم ساده بِیز داشته باشیم، ابتدا قضیه بِیز را در احتمال شرطی درک میکنیم.
بهتر است بِیز ساده را با یک مثال درک کنیم. ما یک مثال بسیار کلی در نظر میگیریم، مانند تاس انداختن. احتمال اینکه عدد 2 را بدست آوریم چقدر است؟ از آنجایی که یک “2” در تاس وجود دارد و در مجموع 6 احتمال وجود دارد، احتمال 1/6 است.
حال، اجازه دهید مثال را کمی بیشتر تقویت کنیم. ما در یک بازی حدس زدن هستیم که باید چند سوال پرسید و بر اساس آن باید عدد و الگوی روی کارت را حدس زد.
در ابتدا 4 احتمال خواهیم داشت و تنها یکی درست است و از این رو احتمال آن ¼ است. فرض کنید الگوی رنگ را حدس زدهایم، اکنون برای حدس زدن الگو فقط 2 احتمال وجود دارد و یکی از آنها باید درست باشد و بنابراین احتمال درست بودن ما ½ است که به وضوح بیشتر از ¼ است.
آیا تفاوت در توضیحات را متوجه شدید؟ در مورد تاس هیچ شرطی وجود ندارد، در حالی که در مورد کارتها شرط این است که رنگ از قبل مشخص باشد.
بنابراین، احتمال وقوع یک رویداد زمانی که یک شرط داده میشود، معلوم است و احتمال شرطی و قضیهای که این امر را دیکته میکند، به عنوان قضیه بِیز شناخته میشود. معادله ریاضی همان به صورت زیر است:
P(Y|X)=(P(X|Y)*P(Y))/P(X)
با توجه به اینکه X اتفاق افتادهاست، به عنوان احتمال وقوع Y خوانده می شود و با احتمال وقوع X برابر است به طوری که Y اتفاق افتاده است، ضرب در احتمال وقوع Y بر احتمال وقوع X. در اینجا، P(Y|X) به عنوان احتمال پسین، P(X|Y) به عنوان احتمال احتمالی، P(Y) به عنوان احتمال قبلی و P(X) به عنوان احتمال شواهد شناخته میشود.
حال با در نظر گرفتن قضیه فوق، اجازه دهید کار ساده بِیز را ببینیم. در مثالهای دنیای واقعی، ممکن است چندین متغیر X در دادهها داشته باشیم و با بیان اینکه چندین متغیر X، مستقل هستند، میتوانیم اثبات کنیم که احتمال یک رابطه ضربی برای یافتن احتمال دنبال میکند. معادله چیزی شبیه به این خواهد بود:
P(Y/(X_1,X_2,X_3,X_4…X_n,))=(P(X_1 | Y)*P(X_2 | Y)*P(X_3 | Y)*…*P(X_n | Y))/(P(X_1 )*P(X_2 )*P(X_3 )*…*P(X_n ) )
با بیان این زمینه، اکنون اجازه دهید مثالی بیاوریم تا از طریق مثالی در طبقه بندی، عملکرد “بِیز ساده” را به طور کامل درک کنیم. این عملکرد در 3 مرحله انجام میشود. اجازه دهید ابتدا به مراحل نگاه کنیم و سپس یک مثال بزنیم و به درک عملی از کار دست یابیم.
در ابتدا جدول فرکانس بر اساس دستهبندی در ویژگیها ساخته میشود. این جدول فرکانس، بر اساس دستهبندی ویژگیهایی است که در مدل وجود دارد. به عنوان مثال، یک ستون دارای 3 دسته است. همه این دسته بندیها گرفتهشده و فراوانی وقوع مربوطه جدول بندی شدهاست.
در مرحله بعد، احتمالات مربوطه با مقولهها و فراوانی متناظر متغیر هدف آنها محاسبه میشود.
در نهایت، محاسبه فوق با استفاده از فرمول قضیه بِیز برای محاسبه احتمال پسین زمانی که هر مجموعه داده جدیدی برای پیشبینی ارسال شده، استفاده میشود.
اکنون وقت آن است که با یک مثال به مراحل نگاه کنیم. بیایید ببینیم که آیا شخصی با توجه به وضعیت درآمد ممکن است ابزاری را بخرد یا نه:
داده اولیه:
وضعیت درآمد | ابزار خریده شده؟ |
کم | بله |
متوسط | بله |
زیاد | بله |
زیاد | بله |
متوسط | خیر |
کم | خیر |
متوسط | بله |
زیاد | بله |
کم | خیر |
متوسط | خیر |
متوسط | بله |
کم | خیر |
زیاد | بله |
زیاد | بله |
مرحله اول: ایجاد جدول فرکانس
گروه درآمد | بله | خیر |
زیاد | 5 | 0 |
متوسط | 3 | 2 |
کم | 1 | 3 |
جمع | 9 | 5 |
مرحله دوم: محاسبه احتمال گروههای درآمد احتمالی
گروه درآمد | بله | خیر | |
زیاد | 5 | 0 | 14/5 = 0.35 |
متوسط | 3 | 2 | 14/5 = 0.35 |
کم | 1 | 3 | 14/4 = 0.3 |
جمع | 14/9 = 0.64 | 14/5 = 0.36 |
مرحله سوم:
اکنون هر زمان که یک مجموعه داده جدید میآید، میتوانیم با استفاده از فرمول احتمال بعدی به احتمال مربوطه بگوییم که آیا شخص ابزار را خواهد خرید یا خیر. فرض کنید که دادههای جدید با گروه درآمد به عنوان متوسط است. ما باید بفهمیم که آیا آن شخص ابزار را میخرد یا خیر.
P(Yes|Mid) = P(Mid|Yes)*P(Yes)/P(Mid)
پس:
P(Mid|Yes) = 3/9 [Total frequency of Mid in Yes = 3, and total frequency in Yes = 9] P(Yes) = 9/14
P(Mid) = 5/14
با جایگزینی مقادیر، P(Yes|Mid) = (3/9*9/14)/(5/14) = 3/5
به طور مشابه، برای P(No|Mid) = 2/5
با جایگزینی مقادیر، P(Yes|Mid) = (3/9*9/14)/(5/14) = 3/5
به طور مشابه، برای P(No|Mid) = 2/5
بنابراین، میتوان نتیجه گرفت که اگر فرد از طبقه متوسط درآمد باشد، تمایل بیشتری به خرید ابزار دارد.
نتیجه:
این روش ساده و در عین حال قدرتمند به ما امتیاز تمایل به رخ دادن یا نبودن یک مسئله را میدهد و این مفهوم را میتوان به راحتی به طبقه بندی چند جملهای تعمیم داد، اگرچه استفاده از آن در پسرفت ممکن است یک تناسب قدرتمند باشد!
مترجم: حنانه بریمانی
آرشیو اخبار و مطالب علمی ژنیران