مقدمهای بر یادگیری عمیق
یادگیری عمیق زیرمجموعهای از یادگیری ماشینی در هوش مصنوعی است، یعنی مبتنی بر شبکه عصبی مصنوعی و یادگیری بازنمایی (representation learning) میباشد، زیرا قادر به اجرای عملکردی است که برای تقلید از عملکرد مغز با ایجاد الگوها و پردازش دادهها استفاده میشود.
یادگیری عمیق همچنین برای تصمیمگیری در زمینههایی مانند اتومبیلهای بدون راننده (برای تشخیص عابران پیاده، چراغهای خیابان، ماشینهای دیگر و غیره)، تشخیص گفتار، تجزیه و تحلیل تصویر (به عنوان مثال، شناسایی سرطان در خون و تومورها)، تلویزیون هوشمند و غیره استفاده میشود.
یادگیری عمیق چیست؟
به طور کلی، ما دو کار را همیشه آگاهانه یا ناخودآگاه انجام خواهیم داد، یعنی آنچه را که از طریق حواس خود احساس میکنیم (مانند احساس گرما، لیوان سرد و غیره) دسته بندی میکنیم و به عنوان مثال، دما را بر اساس دیتایی که از تجربههای قبلی داشتیم پیشبینی میکنیم.
ما وظایف طبقهبندی و پیشبینی را برای چندین رویداد یا کار در زندگی روزمره خود انجام میدهیم؛ مانند زیر:
- نگه داشتن فنجان چای، آب، قهوه و غیره که ممکن است سرد یا گرم باشد.
- دسته بندی ایمیل.
- طبقه بندی زمان روشنایی روز مانند روز یا شب.
- برنامه ریزی بلند مدت آینده بر اساس موقعیت فعلی و چیزهایی که داریم (پیشبینی)
- هر موجودی در دنیا کارهایی را در زندگی خود انجام میدهد، به عنوان مثال حیواناتی مانند کلاغ مکانی را برای ساختن لانه خود دسته بندی میکنند یا خیر، زنبور عسل در مورد برخی عوامل تصمیم میگیرد که کی و کجا عسل تهیه کند. خفاش در طول شب و صبح ها بر اساس طبقه بندی ذاتی میخوابد.
برای دسته بندی، ما بین گربه ها و سگ ها دسته بندی را با کشیدن خط از نقاط داده (data points) انجام میدهیم و در مورد پیش بینی، از طریق نقاط داده خطی میکشیم تا زمان افزایش و کاهش تعدادشان را پیش بینی کنیم.
- دسته بندی
- طبقه بندی بین گربهها و سگها در مغز ما بسیار پیچیدهتر از کشیدن یک خط است و نمیشود آن را در ذهن خود تصور کنیم.
- ما بین دو چیز بر اساس شکل، اندازه، قد، قیافه و غیره دستهبندی ایجاد میکنیم و گاهی اوقات با این ویژگیها دستهبندی سخت میشود، مانند سگ کوچک و گربه تازه متولد شده.
- وقتی بتوانیم در کودکی بین گربهها و سگها دسته بندی انجام دهیم، در موارد بعدی هم میتوانیم سگ یا گربهای را که حتی قبلاً ندیدهایم، دسته بندی کنیم.
- پیش بینی
- برای پیشبینی بر اساس خط، اگر بتوانیم پیشبینی کنیم که در کجا به سمت بالا یا پایین میرود، نقاط داده را ترسیم میکنیم.
- منحنی همچنین پیش بینی داده جدید در محدوده نقاط داده را نشان میدهد، یعنی اینکه داده جدید چقدر به منحنی نزدیک است.
- نقاط دادهای که در تصویر به رنگ قرمز هستند (سمت راست) نمونههایی از هر دو محدوده دادههای موجود و خارج از محدوده هستند و منحنی سعی میکند هر دو را پیش بینی کند.
در نهایت، هم طبقهبندی و هم پیشبینی در یک نقطه مشابه به پایان میرسند، یعنی کشیدن یک خط منحنی از نقاط داده. اگر بتوانیم با استفاده از یک مدل کامپیوتری خط منحنی را بر اساس نقاط دادهای که با آنها تمام شده است، ترسیم کنیم، میتوانیم این را برای اعمال در مدلهای مختلف مانند ترسیم خط منحنی در صفحات سه بعدی و غیره گسترش دهیم. امر فوق را میتوان با آموزش مدلی با حجم زیادی از دادههای برچسب دار و بدون برچسب بدست آورد که به آن یادگیری عمیق میگویند.
نمونههایی از یادگیری عمیق
همانطور که میدانیم، یادگیری عمیق و یادگیری ماشینی زیرمجموعههای هوش مصنوعی هستند، اما فناوری یادگیری عمیق نشان دهنده تکامل بعدی یادگیری ماشینی است. یادگیری ماشینی بر اساس الگوریتمها و برنامههای توسعهیافته توسط انسان عمل میکند؛ در حالی که یادگیری عمیق از طریق یک مدل شبکه عصبی که مشابه انسان عمل میکند، به ماشینها یا رایانهها این امکان را میدهد که دادهها را به روشی مشابه انسانها تجزیه و تحلیل کنند.
این امر زمانی امکان پذیر می شود که ما مدلهای شبکه عصبی را با حجم عظیمی از دادهها برنامه ریزی کنیم، زیرا دادهها سوخت یا غذای مدلهای شبکه عصبی هستند.
برخی از نمونه های موجود در دنیای واقعی آورده شده است:
- بینایی کامپیوتری: بینایی کامپیوتری با الگوریتمهایی برای رایانهها برای درک جهان با استفاده از دادههای تصویر و ویدئو و وظایفی مانند تشخیص تصویر، طبقه بندی تصویر، تشخیص اشیا، تقسیم بندی تصویر، بازیابی تصویر و غیره سروکار دارد.
- پردازش گفتار و زبان طبیعی: پردازش زبان طبیعی با الگوریتمهایی برای رایانهها برای درک، تفسیر و تغییر زبان انسان سروکار دارد. الگوریتمهای NLP با دادههای متنی و صوتی کار میکنند و آنها را به خروجی صدا یا متن تبدیل میکنند. با استفاده از NLP میتوانیم کارهایی مانند تجزیه و تحلیل احساسات، تشخیص گفتار، انتقال زبان و تولید زبان طبیعی و غیره را انجام دهیم.
- وسایل نقلیه خودمختار: مدلهای یادگیری عمیق با حجم عظیمی از دادهها برای شناسایی علائم خیابان برنامه ریزی میشوند. برخی از مدلها در شناسایی عابران پیاده، شناسایی انسان و غیره برای خودروهای بدون راننده در حین رانندگی تخصص دارند.
- تولید متن: با استفاده از مدلهای یادگیری عمیق آموزش داده شده توسط زبان، گرامر و انواع متون و غیره، میتوان برای ایجاد یک متن جدید با املا و دستور زبان صحیح از ویکی پدیا تا شکسپیر استفاده کرد.
- فیلتر کردن تصویر: با استفاده از مدلهای یادگیری عمیق مانند افزودن رنگ به تصاویر سیاه و سفید، میتوان این کار را با مدلهای یادگیری عمیق انجام داد که اگر به صورت دستی این کار را انجام دهیم به زمان بیشتری نیاز داریم.
نتیجه
در نهایت، مروری بر فناوری یادگیری عمیق، کاربردهای آن در دنیای واقعی است. امیدوارم پس از مطالعه این مقاله، درک خوبی از یادگیری عمیق داشته باشید. همانطور که امروز میدانیم، تشخیص تصویر توسط ماشینهایی که با یادگیری عمیق برنامه ریزی شدهاند، در برخی موارد بهتر از انسان عمل میکنند، مانند شناسایی سرطان در خون و تومورها در اسکن MRI و alphaGo گوگل.
مترجم: امید آهنگریان ابهری
برای مطالعه مطالب علمی بیشتر کلیک کنید