میسون در مورد تجزیه آماره تحقیق کرده است.]۲۵[
مونتگومری در کتابی جنبه های عملی کنترل کیفیت چند متغیره را بیان کرده است.]۲۶[
در منابع ]۲۷[،]۲۸[،]۲۹[،]۳۰[ پیرامون کنترل چند متغیره با مشاهدات منفرد بحث شده است.
فصل سوم
روش تحقیق
۳-۱ توزیع نرمال چند متغیره در کنترل کیفیت
در بیشتر بخش با فرض نرمال بودن داده‌های چند متغیره روش‌هایی را ارائه می‌د‌هیم که ما را قادر می‌سازد پارامترهای جمعیت را تخمین بزنیم، با بهره گرفتن از نمونه تصادفی ساده آزمون‌های فرضیه در مورد پارامترهای جمعیت چند متغیره بسازیم. آنالیز داده‌های چند متغیره در مقابل آنالیز جداگانه‌ی هر متغیر قرار می‌گیرد یک جنبه‌ی این تقابل ناشی از مشاهده‌ی همزمان چند عبارت احتمالی است، نظیر P آزمون فرضیه این موضوع مشکل مقایسات چند گانه را ایجاد می‌کند که نیازمند تعدیلات سطوح معنی[۴] برای دستیابی یک سطح معنی کل است. جزء دوم این تقابل توضیح ساختار همبستگی درونی این p بعد (p متغیر) است که روی سطح مفهوم کلی تأثیر می‌گذارد.

( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

با توصیف توزیع نرمال چند متغیره شروع کرده سپس توزیع تست های آماری مختلف را پوشش می‌دهیم. بعد مختصراً به رویه‌های نرمال سازی داده‌های غیر نرمال اشاره می‌کنیم این بخش یک خلاصه و یک تئوری پایه‌ای برای بقیه‌ی بخش ها است .
توزیع نرمال چند متغیره:
یک بردار p بعد از متغیرهای تصادفی به طوری که را یک توزیع نرمال چند متغیره[۵] گویند اگر تابع چگالی آن به صورت زیر باشد.
که در آن بردار ارزش‌های انتظاری[۶] است و داریم.
و ماتریس کوواریانس [۷] است که می‌توانیم تابع چگالی X را با نماد زیر نشان دهیم:
که در آن نشان دهنده‌ی توزیع نرمال چند متغیره با پارامترهای مکانی و پراکندگی است.
وقتی p=1 باشد بردار تک بعدی’ توزیع نرمال با میانگین و واریانس دارد یعنی
یا
وتی p=2 باشد یک توزیع نرمال دو متغیره با دو داده میانگین دو بعدی و ماتریس کوواریاسن است که و به ترتیب واریانس ، کوواریاسن بین آنها هستند.
اگر باشد به ρ همبستگی بین گویند.
اگر مستقل باشند (ρ=۰) توزیع دو متغیر‌ه‌‌ی بینشان حاصل ضرب دو توزیع نرمال تک متغیره است یعنی :
در حالت کلی توزیع نرمال دو متغیر به صورت زیر است:
می‌توان مجموعه‌ای از مقادیر که شامل نسبت خاصی از توزیع چند متغیر باشد را تعریف کرد طوری که مجموعه مقادیر یک ناحیه فرایند طبیعی[۸] را تشکیل می‌هد.

نمودار ۲-۱ توزیع دو متغیره متغیرهای طول ۱و۲ ازمطالعه موردی]۲۴[
مقادیر درونی ناحیه طبیعی فرایند با این اصل مشخص می‌گردند که فاصله آنها از بردار میانگین از مقادیر بحرانی[۹] تخطی نکند، قانون ۳ سگیمای کلاسیک در این متن معادل این است که آزمایش کنیم مشاهده درون ۹۹٫۷۳ درصد (۰٫۹۹۷۳=p ) مرکزی جمعیت مرجع[۱۰] قرار می‌گیرد یا خیر ،در موارد تک متغیره مقادیر بحرانی فوق‌الذکر حدود طبیعی فرایند[۱۱] می‌نامند (ASQC)
نمودارهای ۲-۱ و ۲-۲ توزیع نرمال دو متغیره‌ای را نشان می‌دهند که واریانس‌ها، میانگین‌ها و ضریب همبستگی[۱۲] بر طبق مقادیر تجربی محاسبه شده از روی توزیع دو متغیر‌ه‌‌ی طول ۱و طول ۲ در ۳۰ مشاهده‌ی اول مطالعه موردی[۱۳]بدست آمده‌اند. که در آن و نمودار ۲٫۱ یک نمایش سه بعدی از توزیع فوق است در حالی که نمودار ۲٫۲ خطوط کانتور[۱۴]برای مقادیر مختلف f(length 1,length 2) را نشان می‌دهد.
وقتی پارامترهای فرایند ناشناخته هستند و از روی نمونه‌ تخمین زده می‌شوند (مثل اکثر موارد معمول)، نمی‌توان ناحیه‌ی طبیعی فرایند را که شامل نسبت بیان شده‌ی جمعیت باشد را با صراحت تعیین کنیم. چون اینک یک منبع اضافی عدم اطمینان[۱۵] داریم. هر تعبیری در مورد نسبت جمعیت در ناحیه‌ی خاص فقط با یک سطح اطمینان[۱۶] مشخص ساخته می‌شود. هر ترکیب از نسبت معین و سطح اطمینان معلوم یک ناحیه را تعریف می‌کند. ناحیه آماری تلرانس [۱۷] در اینجا به جای ناحیه‌ی طبیعی[۱۸] فرایند بکار می‌رود. در حالت تک متغیره حدود طبیعی فرایند با حدود آماری تلرانس جایگزین می‌شوند. رویه‌ی نواحی تلرانس آماری در کنترل کیفیت چند متغیره در بخش هشتم تشریح می‌شوند.

نمودار۲-۲ :
خطوط کانتور تابع چگالی دو متغیره با پارامترهای طول ۱ و طول ۲از مطالعه موردی اول]۲۴[
شکل توزیع چند متغیره به بردار میانگین ماتریس کوواریانسبستگی دارد. وقتی یکی یا هر دو این پارامترها نامعلوم باشند (مثل موارد معمول) به صورت تجربی و از داده‌ها تخمین زده می‌شوند. اگر ،n بردارp بعدی مستقل مشاهدات از ، باشد؛ بردار میانگین مشاهده‌شده‌ی و ماتریس کوواریانس s بصورت زیر بدست می‌آیند:
که به ترتیب تخمین‌های نااریت هستند.
توجه داشته باشید تحت توزیع نرمال، بردار یک تخمین حداکثر درستنمایی (MLE) برای است در حالیکه MLE مربوط به ∑ عبارت است از
(l,l’) امین عنصر ماتریس S کوواریانس تخمینی بین متغیرهای است که است یعنی:
عناصر قطری S متناظر با واریانس‌های نمونه هستند، وقتی کوواریانس با انحراف معیاریهای مناسب استاندارد شود، مقدار تخمینی ،حاصل ضریب همبستگی بین دو متغیر را تخمین می‌زند.
اگر نمونه از k زیر گروه تشکیل شده باشد که اندازه‌ی هر کدام n باشد و اگر میانگین و ماتریس کوواریانس j امین زیر گروه به ترتیب باشد. آنگاه میانگین کل و ماتریس کوواریانس آمیخته[۱۹] به صورت زیر تعریف می‌گردد.
محاسبات را با دو مجموعه داده‌های شبیه سازی شده تشریح می‌کنیم. اولین نمونه از یک توزیع دو متغیره با مشاهدات غیر گروهبندی تولید شده است.
مشاهدات در دومین گروه داده‌ها چهار متغیره دو به دو گروهبندی شده دارد، یعنی دو زیر گروه ((k=2. فایده‌ی استفاده از داده‌های شبیه سازی شده برای توضیح تئوری این است که توزیع اصلی و پارامترهایش معلوم هستند، بنابراین می‌توانیم عملکرد آزمون فرضیه آماری را در شرایط کنترل شده بررسی کنیم در اولین مجمموعه داده‌ها، پارامترهای ۵۰ مشاهده‌ی اول همانند مقادیر تجربی محاسبه شده برای پارامتر ۱ و پارامتر ۲ برای ۳۰ مشاهده‌ی اول مطالعه موردی اول هستند یعنی:
و و ماتریس کوواریانس جمعیت ∑۱۰۰۰۰ برابر است با :
۵۰ مشاهده‌ی اول یک نمونه پایه[۲۰] تحت کنترل (با قابلیت فرایند[۲۱] تحت کنترل) را نشان می‌هد میانگین نمونه برای آن مشاهدات عبارت است از:
و عناصر ماتریس s عبارتند از:
یعنی
یادآوری می کنیم در سراسر کتاب محاسبات می‌توانند توسط minitab با سایرنرم افزارهای آماری انجام گیرد.
با داده‌های ضریب ماتریس s ضریب همبستگی نمونه به صورت زیر بدست می‌آید
برای دومین مجموعه داده‌ها پارامترهای ۵۰ زیر گروه اول با مقادیر تجربی محاسبه شده برای ۴ قطر (یعنی قطر ۱-۴) در ۳۰ مشاهده‌ی اول مطالعه موردی اول تعیین می‌گردد یعنی:
و ماتریس کوواریانس ∑ ۱۰۰۰۰ برابر است با:
توزیع اصلی داده‌ها شبیه سازی شده نرمال چند متغیره با پارامتر های فوق است داده‌ها در ۵۰ زیر گروه به اندازه ۲ برای هر کدام دسته بندی شده‌اند بنابراین اولین گروه شامل مشاهدات زیر است:
و بردار میانگین اولین زیر گروه عبارت است از:
و ماتریس کوواریانس درونی زیر گروه (x10000) برابر است با:
و به همین ترتیب برای ۵۰ زیر گروه محاسبات انجام شده و نتایج زیر بدست آمده‌اند:
برنامه minicab به راحتی ماتریس محاسبه می کند.
جزئیات تئوی تخمین های به صورت گسترده مطالعه شده، و سعی شده است تحت معیارهای مختلف (کفایت[۲۲]، انطباق[۲۳]، تمامیت[۲۴]) بهینه باشد.
جزئیات تئوری تخمین برای نمونه‌های نرمال تصادفی با قضایای زیر بیان می‌گردند ]۱۷[:
i)

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...