You are here

فصل سوم -- پیدا کردن گروه ها

در فصل دو درباره راه های پیدا کردن چیز هایی که ارتباط نزدیکی با هم دارند بحث کردیم، بنابراین، برای مثال شما می توانید افرادی که با شما در مورد فیلم ها هم سلیقه هستند را پیدا کنید.

این فصل با گسترده کردن این ایده به معرفی مفهوم دسته بندی داده ها(Data Clustering)می پردازد و با معرفی روشی برای کشف و مصور سازی و نمایش گروه ی از چیز ها، افراد یا ایده ها که به هم بسیار مرتبط هستند می پردازد. در این فصل، شما می آموزید: چطور داده ها را از منابع مختلف تهیه سازید، دو روش مختلف الگوریتم دسته بندی را خواهیم آموخت، در مورد محاسبه فواصل بیشتر خواهیم گفت، یک تکه کد برای نمایش گرافیکی از گروه های تولید شده خواهیم نوشت، و در نهایت روشی را برای نشان دادن مجموعه داده های خیلی پیچیده در یک تصویر دو بعدی خواهیم دید.

در برنامه هایی که عملیات پردازشی روی حجم عظیم داده ها را انجام می دهند دسته بندی داده ها به کرات مورد استفاده قرار می گیرد. خرده فروشانی که خرید مشتریان را رهگیری می کنند می توانند از این اطلاعات برای تشخیص دسته هایی از مشتریان که الگوی خرید مشابه ای دارند استفاده کنند، به علاوه برای نمایش گرافیکی این اطلاعات نیز استفاده می شود. افراد با سن مشابه و درآمد مشابه ممکن است سبک های بسیار متفاوت پوشش داشته باشند، اما با استفاده از دسته بندی، شرکت های تولید و عرضه پوشاک می توانند یک استراتژی خرده فروشی و یا استراتژی بازاریابی تهیه کنند. دسته بندی همچنین بصورت بسیار زیادی در محاسبات زیستی برای پیدا کردن گروه هایی از ژن ها که رفتار مشابه ای از خود نشان میدهند مورد استفاده قرار می گیرد. که ممکن است نشانگر این باشند که آنها به یک درمان به روش مشابه ای پاسخ می دهند یا اینکه قسمتی از یک مسیر بیولوژیکی هستند.

به دلیل اینکه این کتاب درباره هوش جمعی است، مثال های این فصل از منابعی است که افراد در اطلاعات مختلفی مشارکت کرده اند. مثال اول با استفاده از محتوای وبلاگ هاست، موضوعاتی که که مورد بحث وبلاگ هاست، و کلماتی که بیشتر در هر وبلاگ استفاده شده است و محتوای آن می توانند نشان دهد آن وبلاگ بیشتر درباره چه موضوعات صحبت می کند و برای دسته بندی وبلاگ ها در گروه ها مورد استفاده قرار می گیرد. مثال دوم درباره یک سایت انجمن است که در آن افراد چیز هایی که دارند و تمایل دارند داشته باشند را لیست می کنند، ما از این اطلاعات برای نمایش اینکه خواسته های افراد می توانند دسته بندی شوند استفاده می کنیم. 

Add new comment

انیمیشن پیام راشل کوری