شما اینجا هستید
وقتی یک دسته بندی کننده کافی نیست
ما دو مدل ماشینهای پیشبینی و دسته بندی کننده ی ساده تا کنون دیدیم. هر دو مقداری ورودی می گرفتید، یک سری محاسبات انجام میدادند . سپس یک جواب بر می گرداندند. اما این روشهایی که ما دیدم طوری نیست که بتوان بر روی همه مشکلاتی که ما میخواهیم با شبکههای عصبی حل کنیم قابل استفاده باشد.
در اینجا ما محدودیتهای این دسته بندی کننده خطی را با یک مثال ساده نشان می دهیم. چرا یک راست نمیرویم سراغ شبکههای عصبی پیشرفته تر و میخواهیم در مورد محدودیتهای دسته بندی کننده خطی مبتنی بر شبکه عصبی که پیشتر گفتیم توضیح دهیم؟ چونکه کلید طراحی ویژگیهای شبکههای عصبی پیشرفتهتر در فهم این محدودیت است . پس بیایید کمی روی آن وقت بگذاریم.
بیایید بیخیال حشرات باغ شویم و به توابع منطقی بولی نگاهی بیندازیم. اگر آن را تا حالا نشنیده اید. نگران نباشید. جرج بول یک فیلسوف و ریاضیدان و نام او را روی تابع های «و»(به انگلیسی AND) و «یا» (به انگلیسی OR) گذاشته اند.
تابع های منطقی بولی شبیه ساختار یک زبان هستند. اگر شما بگوید : هنگام غذا خوردن زمانی می توانی تکه گوشتت را بخوری که سبزی های غذا را خورده باشی «و» نان هم بخوری. بولی «و» زمانی درست است که هر دو شرط درست باشند.
بولی منطقی «و» یا همان AND اگر یکی از شرط ها یا هر دو برقرار نباشند، درست نیست. من سبزی جات را نخوردم. پس نمیتوانم گوشت بخورم. نان نخوردم. پس نمیتوانم گوشت بخورم. سبزی جات و نان خوردم پس میتوانم گوشت بخورم.
به همین ترتیب اگر بگوییم زمانی به پارک میرویم که آخر هفته باشد یا روزی که خسته باشیم باشد. بولی «یا» یا همان OR چه زمانی که آخر هفته باشد یا خسته باشیم درست است. اگر آخر هفته باشد و خسته باشیم چطور. باز هم درست است. پس اگر هر کدام از شرط ها یا هر دو آنها برقرار باشد بولی «یا» درست است. مثل بولی «و» مجبور نیستیم که همه شرط ها برقرار باشد. اگر یکی هم برقرار باشد کافی است.
اگر به گذشته فکر کنیم که برای اولین بار نگاهی به تابع ها داشتیم. ما آنها را به عنوان یک ماشین میدیدیم که تعدادی ورودی می گیرد، روی آنها کار هایی انجام می دهد، و یک خروجی بر می گرداند. تابع های منطقی بولی نیز به صورت دقیقتر دو ورودی میگیرند و یک جواب بر می گردانند:
کامپیوتر ها معمولاً درستی را با عدد 1 نمایش میدهند و غلط را با عدد صفر(0) نمایش می دهند.
جدول زیر به صورت خلاصه عملکرد تابع های «و»(AND) و «یا»(OR) را روی دو ورودی A و B نشان می دهد.
ورودی A |
ورودی B |
AND منطقی |
OR منطقی |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
1 |
1 |
1 |
1 |
1 |
شما به وضوح میتوانید ببینید، تابع AND تنها وقتی درست است که هر دو ورودی A و B درست باشند. همینطور میبینید که تابع OR اگر یکی از ورودی های A و B یا هر دو درست باشند درست است.
تابع های منطقی بولی در علوم کامپیوتر خیلی مهم هستند. در حقیقت کامپیوتر ها از مدار های الکتریکی ساخته شدهاند که این تابع های منطقی را پیادهسازی می کنند. حتی عملیات های ریاضی در آنها نیز با ترکیب مدار های تابع های منطقی ساده پیادهسازی شده اند.
در نظر بگیرید از یک دسته بندی کننده ساده برای یادگیری از دادههایی که به صورت منطقی جمع آوری شدهاند استفاده کنیم. این کار یک روش معمول و پرکاربرد در میان دانشمندان است که روابط بین بعضی مشاهدات را میخواهند استخراج کنند. برای مثال آیا مارالیا زمانی که باران میبارد «و» دما بالاتر از ۳۵ درجه است بیشتر است. سؤالی دیگری با OR : آیا وقتی باران میبارد «یا» دما بیشتر از ۳۵ درجه است مالاریا وجود دارد؟
در مطلب پیشتر گفته شده ما میتوانستیم کارهای خودمان را از طریق محاسبات عددی انجام بدهیم. اما این کار را نکردیم. دلیل آن این است که اساس کار یکی است. در حقیقت شکلهای مختلفی از این خط تقسیم وجود داشت که به خوبی کار می کرد. اما نکته اصلی این است که همه آنها در فرم y=ax+b بودند و برای یادگیری تابع بولی AND کار استفاده می شدند.
خوب بیایید تابع بولی OR را به شکل مشابه ای ترسیم کنیم و به بررسی آن بپردازیم:
در اینجا فقط نقطه (0,0) قرمز است چون تنها جایی است که در آن هر دو A و B غلط هستند. هر ترکیب دیگری از A و B نتیجه درست می دهد. خوبی نمایش تصویری در اینجا این است که نشان میدهد که یک دسته بندی کننده خطی میتواند بر روی تابع منطقی OR نیز به خوبی کار کند.
خوب میرسیم به تابع بولی بعدی که XOR نامیده می شود. یعنی حالتی که در آن خروجی هنگامی صحیح است که تنها ورودی A یا B درست باشند ولی هر دو با هم درست نباشند.
به عبارتی وقتی که هر دو ورودی غلط باشند یا هر دو ورودی درست باشند خروجی غلط است.
جدول زیر این موضوع را نشان میدهد
ورودی A |
ورودی B |
XOR منطقی |
0 |
0 |
0 |
1 |
0 |
1 |
0 |
1 |
1 |
1 |
1 |
0 |
خوب بیایید این تابع را به صورت گرافیکی روی نمودار ترسیم کنیم و خروجی ها را به صورت رنگی نشان دهیم
خوب به یک چالش برخوردیم. مثل اینکه با تنها یک خط نمیشود قرمز ها را از سبزها جدا کرد. یعنی یک خط بر روی تابع XOR جواب نمی دهد. یعنی تنها یک دسته بندی کننده خطی نمیتواند تابع منطقی XOR را یاد بگیرد. یعنی درحالتی که در دادههای آموزشی ما حالت منطقی XOR داشته باشیم غیر ممکن است که با تنها یک دسته بندی کننده خطی بتواند جایی را پیدا کند که دو دسته را از هم جدا کند. پس یعنی یک خط دسته بندی کنند ساده نمیتواند تابع XOR را یاد بگیرد.
خوب ما حالا یک محدودیت اساسی دسته بندی کننده خطی را نشان دادیم. نشان دادیم که یک دسته بندی کننده ساده برای مشکلاتی که تنها با یک خط صاف قابل جدا کردن نیستند کارایی ندارد.
ما میخواهیم که شبکههای عصبی برای وظایف خیلی خیلی متفاوت و حالتهای مختلف که بسیاری از آنها هم با خط صاف قابل جدا سازی نیستند کار کند.
خوب پس نیاز داریم این مشکل را حل کنیم
خوشبختانه راه حل ساده است. در حقیقت نمودار زیر پیشنهاد میدهد که از دو خط صاف برای حل این مشکل استفاده کنیم. ما از چند دسته بندی کننده خطی با هم استفاده می کنیم.
این یکی دیگر از مفاهیم و ایدههای اصلی در شبکههای عصبی است. تصور کنید که تعداد زیادی دسته بندی کننده خطی میتوانند بسیاری از مجموعه دادههایی که شکل سادهای ندارد را دسته بندی کنند.
در حقیقت شبکههای عصبی از چندین و چند دسته بندی کننده ساخته شدهاند که با هم کار می کنند. بیایید قبل از اینکه به ساخت این نوع شبکهها بپردازیم به طبیعت برگردیم و به مغز حیواناتی که دیدگاه شبکههای عصبی از آنها الهام گرفته شده نگاهی بیندازیم.
نکات کلیدی:
دسته بندی کننده های خطی ساده نمیتوانند دادههایی که تنها با یک خط قابل جدا سازی نیستند را از هم جدا کند. برای مثال دادههایی که از تابع منطقی XOR تبعیت می کنند.
راه حل ساده است. ما از چند دسته بندی کننده خطی برای جدا سازی دادههایی که تنها با یک خط قابل جدا سازی نیستند استفاده می کنیم.
دیدگاه جدیدی بگذارید