الگوریتم بِیز ساده در یادگیری ماشین

تعریف بِیز ساده در یادگیری ماشینی:

بیز ساده در یادگیری ماشین به عنوان مدل احتمالی در تکنیک یادگیری ماشین، در ژانر یادگیری نظارت شده تعریف می شود، که در موارد استفاده طبقه‌بندی متنوع عمدتاً استفاده می شود، اما برای پسرفت (البته با تناسب اجباری!) نیز قابل استفاده است.

دلیل قرار دادن “ساده” در مقابل نام این الگوریتم به این دلیل است که فرض می‌کند ویژگی‌هایی که وارد مدل می‌شوند، مستقل از یکدیگر هستند یا به عبارت دیگر، تغییرات انجام شده در یک متغیر بر روی متغیرهای دیگر تأثیر نمی‌گذارد. این یک فرضیه قوی است و یک فرض اساسی است و تأثیر متغیر، قطعا موجود است. با توجه به این الگوریتم، اثر متغیر وجود دارد.

با توجه به این الگوریتم، بِیز ساده یک الگوریتم ساده و در عین حال بسیار قدرتمند است. به دلیل پیچیدگی کمتر، این گزینه برای هر یک از الگوریتم‌هایی است که در آن باید به سرعت به یک درخواست پاسخ داد یا برای ارائه بینش‌های اساسی و در عین حال قدرتمند از داده‌ها، باید محاسباتی انجام داد!

الگوریتم بِیز ساده در یادگیری ماشین

الگوریتم “بِیز ساده” چگونه در یادگیری ماشین کار می‌کند؟

در مقدمه فهمیدیم که “بِیز ساده” یک الگوریتم ساده است که فرض می کند عواملی که بخشی از تجزیه و تحلیل هستند مستقل از یکدیگر هستند. اما کلمه دیگر “بِیز” چه می شود. برای اینکه درک عمیق تری از الگوریتم ساده بِیز داشته باشیم، ابتدا قضیه بِیز را در احتمال شرطی درک می‌کنیم.

بهتر است بِیز ساده را با یک مثال درک کنیم. ما یک مثال بسیار کلی در نظر می‌گیریم، مانند تاس انداختن. احتمال اینکه عدد 2 را بدست آوریم چقدر است؟ از آنجایی که یک “2” در تاس وجود دارد و در مجموع 6 احتمال وجود دارد، احتمال 1/6 است.

حال، اجازه دهید مثال را کمی بیشتر تقویت کنیم. ما در یک بازی حدس زدن هستیم که باید چند سوال پرسید و بر اساس آن باید عدد و الگوی روی کارت را حدس زد.

در ابتدا 4 احتمال خواهیم داشت و تنها یکی درست است و از این رو احتمال آن ¼ است. فرض کنید الگوی رنگ را حدس زده‌ایم، اکنون برای حدس زدن الگو فقط 2 احتمال وجود دارد و یکی از آنها باید درست باشد و بنابراین احتمال درست بودن ما ½ است که به وضوح بیشتر از ¼ است.

آیا تفاوت در توضیحات را متوجه شدید؟ در مورد تاس هیچ شرطی وجود ندارد، در حالی که در مورد کارت‌ها شرط این است که رنگ از قبل مشخص باشد.

بنابراین، احتمال وقوع یک رویداد زمانی که یک شرط داده می‌شود، معلوم است و احتمال شرطی و قضیه‌ای که این امر را دیکته می‌کند، به عنوان قضیه بِیز شناخته می‌شود. معادله ریاضی همان به صورت زیر است:

P(Y|X)=(P(X|Y)*P(Y))/P(X)

 

با توجه به اینکه X اتفاق افتاده‌است، به عنوان احتمال وقوع Y خوانده می شود و با احتمال وقوع X برابر است به طوری که Y اتفاق افتاده است، ضرب در احتمال وقوع Y بر احتمال وقوع X. در اینجا، P(Y|X) به عنوان احتمال پسین، P(X|Y) به عنوان احتمال احتمالی، P(Y) به عنوان احتمال قبلی و P(X) به عنوان احتمال شواهد شناخته می‌شود.

حال با در نظر گرفتن قضیه فوق، اجازه دهید کار ساده بِیز را ببینیم. در مثال‌های دنیای واقعی، ممکن است چندین متغیر X در داده‌ها داشته باشیم و با بیان اینکه چندین متغیر X، مستقل هستند، می‌توانیم اثبات کنیم که احتمال یک رابطه ضربی برای یافتن احتمال دنبال می‌کند. معادله چیزی شبیه به این خواهد بود:

P(Y/(X_1,X_2,X_3,X_4…X_n,))=(P(X_1 | Y)*P(X_2 | Y)*P(X_3 | Y)*…*P(X_n | Y))/(P(X_1 )*P(X_2 )*P(X_3 )*…*P(X_n ) )

الگوریتم بِیز ساده در یادگیری ماشین

با بیان این زمینه، اکنون اجازه دهید مثالی بیاوریم تا از طریق مثالی در طبقه بندی، عملکرد “بِیز ساده” را به طور کامل درک کنیم. این عملکرد در 3 مرحله انجام می‌شود. اجازه دهید ابتدا به مراحل نگاه کنیم و سپس یک مثال بزنیم و به درک عملی از کار دست یابیم.

در ابتدا جدول فرکانس بر اساس دسته‌بندی در ویژگی‌ها ساخته می‌شود. این جدول فرکانس، بر اساس دسته‌بندی ویژگی‌هایی است که در مدل وجود دارد. به عنوان مثال، یک ستون دارای 3 دسته است. همه این دسته بندی‌ها گرفته‌شده و فراوانی وقوع مربوطه جدول بندی شده‌است.

در مرحله بعد، احتمالات مربوطه با مقوله‌ها و فراوانی متناظر متغیر هدف آنها محاسبه می‌شود.

در نهایت، محاسبه فوق با استفاده از فرمول قضیه بِیز برای محاسبه احتمال پسین زمانی که هر مجموعه داده جدیدی برای پیش‌بینی ارسال شده، استفاده می‌شود.

 

اکنون وقت آن است که با یک مثال به مراحل نگاه کنیم. بیایید ببینیم که آیا شخصی با توجه به وضعیت درآمد ممکن است ابزاری را بخرد یا نه:

داده اولیه:

وضعیت درآمد ابزار خریده شده؟
کم بله
متوسط بله
زیاد بله
زیاد بله
متوسط خیر
کم خیر
متوسط بله
زیاد بله
کم خیر
متوسط خیر
متوسط بله
کم خیر
زیاد بله
زیاد بله

 

مرحله اول: ایجاد جدول فرکانس

گروه درآمد بله خیر
زیاد 5 0
متوسط 3 2
کم 1 3
جمع 9 5

 

 

مرحله دوم: محاسبه احتمال گروه‌های درآمد احتمالی

 

گروه درآمد بله خیر  
زیاد 5 0 14/5 = 0.35
متوسط 3 2 14/5 = 0.35
کم 1 3 14/4 = 0.3
جمع 14/9 = 0.64 14/5 = 0.36  

 

مرحله سوم:

اکنون هر زمان که یک مجموعه داده جدید می‌آید، می‌توانیم با استفاده از فرمول احتمال بعدی به احتمال مربوطه بگوییم که آیا شخص ابزار را خواهد خرید یا خیر. فرض کنید که داده‌های جدید با گروه درآمد به عنوان متوسط است. ما باید بفهمیم که آیا آن شخص ابزار را می‌خرد یا خیر.

P(Yes|Mid) = P(Mid|Yes)*P(Yes)/P(Mid)

پس:

P(Mid|Yes) = 3/9 [Total frequency of Mid in Yes = 3, and total frequency in Yes = 9] P(Yes) = 9/14
P(Mid) = 5/14

با جایگزینی مقادیر، P(Yes|Mid) = (3/9*9/14)/(5/14) = 3/5

به طور مشابه، برای P(No|Mid) = 2/5

با جایگزینی مقادیر، P(Yes|Mid) = (3/9*9/14)/(5/14) = 3/5

به طور مشابه، برای P(No|Mid) = 2/5

الگوریتم بِیز ساده در یادگیری ماشین

بنابراین، می‌توان نتیجه گرفت که اگر فرد از طبقه متوسط ​​درآمد باشد، تمایل بیشتری به خرید ابزار دارد.

نتیجه:

این روش ساده و در عین حال قدرتمند به ما امتیاز تمایل به رخ دادن یا نبودن یک مسئله را می‌دهد و این مفهوم را می‌توان به راحتی به طبقه بندی چند جمله‌ای تعمیم داد، اگرچه استفاده از آن در پسرفت ممکن است یک تناسب قدرتمند باشد!

مترجم: حنانه بریمانی

آرشیو اخبار و مطالب علمی ژنیران

منبع

از این مطلب چقدر راضی بودید؟

روی ستاره کلیک کنید تا نظرتون ثبت بشه

4 / 5. تعداد رای دهندگان: 1

تا حالا امتیازی برای این مطلب ثبت نشده؛ با ثبت نظرتون مارو خوشحال می‌کنید