شما اینجا هستید

دسته بندی تفاوت چندانی با پیش‌بینی ندارد

ما ماشین قبلی را ماشین پیش‌بینی نامیدیم، به خاطر اینکه یک ورودی می‌گیرد و یک پیش بینی انجام می‌دهد در مورد اینکه خروجی در دنیای واقعی چیست. پیش‌بینی ها را با تنظیم پارامتر های داخلی بهبود می دهیم. پارامتر های داخلی را با استفاده از خطا هایی که درحین مقایسه پیش‌بینی ها با خروجی  های دنیای واقعی می‌بینیم بهبود می دهیم.
حالا به این نمودار که اندازه های طول و عرض حشرات یک باغ را نشان داده شده نگاه کنید.

شما به وضوح می‌توانید دو دسته حشره را ببینید. کرم‌های ابریشم نازک و دراز هستند. کفشدوزک ها پهن و کوتاه هستند

از قسمت قبل ماشین پیش‌بینی را به یاد دارید که کیلومتر را به مایل تبدیل می کرد؟ آن ماشین پیش‌بینی کننده در قلب خود یک تابع خطی قابل تنظیم داشت. میدانیم که تابع های خطی یک خط مستقیم را  ترسیم می کنند.این خط مستقیم وضعیت خروجی ها نسبت به ورودی های وارد شده را به ما می دهند.
عدد ثابت c شیب این خط صاف را تغییر می دهد.
چه اتفاقی می‌افتد اگر یک خط صاف یک جایی بالای نمودار خود رسم کنیم؟

ما نمیتوانیم از این خط همانطور که از آن برای تبدیل یک واحد (کیلومتر) به یک واحد دیگر (مایل) استفاده کردیم، استفاده کنیم. چون در اینجا قرار نیست به ازای یک عدد وضعیت عدد دیگر را به ما بدهد. اما شاید بتوانیم از این خط برای جدا سازی چیز های مختلف استفاده کنیم.


در نمودار بالا، اگر بتوانیم یک خط رسم کنیم که کرم‌های ابریشم را از کفشدوزک ها جدا کنیم، آنوقت میتوانیم از آن برای دسته بندی حشره ناشناخته استفاده کنیم. این کار را بر اساس دو واحد عرض و طول حشره انجام می دهیم. البته این خط هنوز نمی‌تواند یک دسته بندی درست به ما ارائه بدهد. چون بر اساس این خط نیمی از کرم‌های ابریشم یک طرف خط و نیمی دیگر سمت کفشدوزک ها هستند.
بیایید یک خط دیگر رسم کنیم. باز شیب خط را تغییر می‌دهیم و ببینم که چه اتفاقی می افتد.


این خط دیگر به هیچ دردی نمی‌خورد. حتی دو مدل حشره را از هم جدا نکرده است.
یک تلاش دیگر می کنیم:


این یکی خیلی بهتر شد. این خط به خوبی کرم‌های ابریشم را از کفشدوزک ها جدا کرده است. ما می‌توانیم از این خط به عنوان دسته بندی کننده حشرات استفاده کنیم. در اینجا برای ساده کردن صورت مسأله در نظر گرفتیم که هیچ مدل حشره ای دیگری غیر از این دو مدل وجود ندارد. این موضوع فعلاً قابل قبول است. در نظر بگیرید که در دفعه بعدی که کامپیوتر ما با یک دست رباتیک خود یک حشره جدید را بردارد با اندازه‌گیری پهنا و ارتفاع آن می‌تواند آن را با استفاده از  این خط آن را  به خوبی دسته بندی کند. مثلاً بگوید این یک کرم ابریشم است به خاطر اینکه  مشخصات آن در بالای خط قرار گرفت. این مدل دسته بندی واقعا ساده است،  اما در عین حال واقعاً قدرتمند است.


ما در اینجا می‌بینیم که یک تابع خطی درون ماشین پیش‌بینی ساده ما چطور میتواند به عنوان دسته بندی کننده یک داده جدید که قبلاً آن را ندیده‌ایم استفاده شود.
اما ما یک عنصر حیاطی را جا انداختیم. چطور خط مناسب را ترسیم کنیم؟ چطور یک خطی را که خیلی خوب دو  دسته را از هم جدا و تقسیم نکرده است را بهبود بخشیم؟ پاسخ به این سؤال یکی از عناصر اصلی سازنده شبکه‌های عصبی است که در قلب هر شبکه عصبی مصنوعی پیدا می شود.

دیدگاه جدیدی بگذارید