-یکپارچگی داده‌ها
-داده‌های یکپارچه
-سازماندهی داده‌ها
داده‌های مجدد سازماندهی شده

-انتخاب روش مدل‌سازی
روش مدل‌سازی
فرضیات مدل‌سازی
-تولید تست
طرح تست
-ساخت مدل
-تنظیمات پارامترهای مدل
شرح مدل
-ارزیابی مدل
ارزیابی مدل
پارامترهای اصلاح شده

-ارزیابی نتایج
ارزیابی داده‌ها
کاوش نتایج بر مبنای معیارهای موفقیت کسب­وکار
مدل­های بهبود یافته
-بازبینی فرایند
بازبینی فرایند
-تعیین اقدامات بعدی
لیستی از اقدامات و تصمیمات ممکن

-به‌کارگیری طرح
طرح توسعه
-نظارت و نگهداری طرح
طرح نگهداری و نظارت
-گزارش نهایی پروژه
گزارش نهایی
ارائه نهایی
-بازبینی پروژه
مستندات تجربی

۲-۸-۵- معرفی روش‌های داده‌کاوی
روش‌های داده‌کاوی در یک تقسیم ­بندی کلی به دو دسته روش‌های توصیفی و روش‌های پیش­بینانه تقسیم می­شوند. روش‌های توصیفی به خواص عمومی داده‌ها می­پردازند. بدین ترتیب که الگوهایی قابل تفسیر توسط انسان از داده‌ها استخراج می­ کنند. در رویکرد پیش­بینانه هدف پیش ­بینی رفتارهای آینده است. در این روش­ها از چند متغیر جهت پیش ­بینی مقادیر آینده استفاده می­ شود. تقسیم ­بندی برخی روش‌های داده‌کاوی در شکل ۲-۹ نشان داده شده است.

شکل ۲-۹ دسته‌بندی کلی عملکردهای داده‌کاوی
در ادامه برخی از این روش­ها به طور مختصر معرفی خواهند شد.
۲-۸-۵-۱- دسته‌بندی[۷۵]
این روش از رایج­ترین، محبوب‌ترین و قابل درک­ترین روش‌های داده‌کاوی می‌باشد. در این روش هر یک از نمونه‌ها به یکی از گروه‌ها یا دسته‌ ها تخصیص می‌یابد. در روش دسته‌بندی هر نمونه با تعدادی خصوصیت[۷۶] که یکی از این خصوصیت­ها صفت کلاس مربوط به آن نمونه است، شناخته می­ شود. برای دسته‌بندی نمونه­ها جهت استخراج مدل، وجود صفت کلاس برای هر نمونه الزامی است. هدف از دسته‌بندی، یافتن مدلی بر اساس خصوصیت قابل پیش ­بینی یا کلاس هر نمونه به عنوان تابعی از سایر ویژگی‌های آن نمونه می­باشد [۱]. این روش به انتساب نمونه­ها به دسته­ها بر اساس صفتی قابل پیش ­بینی اشاره دارد [۲].
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت nefo.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

مطابق شکل ۲-۹ از الگوریتم‌های شاخص این روش می­توان درخت تصمیم ­گیری[۷۷]، شبکه‌های عصبی[۷۸] و ناوی بیز[۷۹] را نام برد. این الگوریتم­ها معمولاً به یک مقدار هدف نیاز دارند تا هر داده را به یکی از مجموعه کلاس­های از پیش تعریف شده منتسب کنند. به چنین الگوریتم­هایی که برای یادگیری نیاز به مقدار هدف دارند الگوریتم‌های با ناظر[۸۰] گویند.
دسته‌بندی در مسائل تجاری مانند مدیریت ریسک، تبلیغات هدفمند[۸۱] و تحلیل روی‌گردانی[۸۲] مشتری کاربرد دارد.
۲-۸-۵-۲- درخت تصمیم
مهم‌ترین مدلی که در این رویکرد استفاده می­ شود، درخت تصمیم ­گیری می­باشد. در این روش درختی ساخته می­ شود و در هر گره از آن آزمونی بر روی یک از ویژگی­ها انجام می­ شود و داده با توجه به مقدار مشخصه‑های خود در راستای یکی از فرزندان گره هدایت می­ شود، تا جایی که داده به برگ برسد. هر برگ نشان دهنده یک دسته می­باشد [۱۱].
جدول ۲-۵ نمونه ­ای از یک مسئله دسته‌بندی را نشان می‌دهد. X1 تا Xm ویژگی­هایی هستند که به کمک آن­ها کلاس (C1 یا C2) هر یک از نمونه­های U1 تا Un مشخص می­ شود. aij مقدار مربوط به ویژگی j از نمونه i است.
جدول ۲-۵ نمونه داده‌های مورد نیاز در یک مسئله مدل‌سازی به روش دسته‌بندی [۱]

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...