تحقيق آمار و مدل سازي

فصل اول : مقدمه موضوعي و تاريخي
I) ضرورت آمار در تحقيق علمي :
روش هاي محاسبه و استنباط آماري از مباني ضروري تحقيق علمي هستند . اما اين حقيقت نه تنها براي مردم عادي بلكه غالباً براي دانشجوي مبتدي چنان كه بايد ، روشن نيست . تصور عامه اين است كه آمار نوعي تفنن در محاسبه و به كار بردن فرمول هاست و ماند فرمول هاي رياضي محض كه همگان بدان رغبت ندارند ممكن است محاسبات آماري هم داراي فايدة آشكار و عملي نباشد . علت اصلي اين ابهام و ناآشنايي آن است كه عامة مردم ( و مبتدي در تحصيل علم ) ممكن است به نحوي از نتايج و قواعد علمي با خبر شوند و از صورت كلي و مختصر و تقريبي آنها آگاهي يابند ، اما به دقايق و جزئيات ، از جمله به منطق تحقيق و چگونگي تشكيل حقيقت علمي ، پي نمي برند و ناچار متوجه نمي شوند كه ضرورت آمار در علم به عنوان وسيله تحقيق از كجاست . سپس ساده ترين راه نشاني دادن ضرورت و فايده آن اين است كه مراحل عمده و تحقيق را به اجمال تشريح كنيم .

II) مختصر تاريخ تحول آمار :
مطالعه تاريخ تحولهر علم ، جز فوايد كلي كه از نظر شناخت موجبات پيدايش و جهات توسعه آن در بر دارد ، به لحاظ درك بعضي خصوصيات موضوعي آن علم نيز حائز اهميت است . مطالعه سير تكاملي علم آمار را از قرن هفدهم همزمان با پيدايش و توسعة حساب احتمالات در رياضيات مي توان آغاز كرد وسه دوران در آن تشخيص داد . توسعه و تحول رياضيات در قرن هاي شانزدهم و هفدهم از لحاظ تاريخ آمار قابل توجه است و به اين جهت اين دو قرن دوران نخستين تحول اين علم را تشكيل مي دهد . در دوران دوم كه شامل قرن هجدهم و قرن نوزدهم است ، اصول احتمالات به تدريج به كار برده شدند و بدين لحاظ اين دوران را مي توان سرآغاز رشته هاي مختلف آمار عملي دانست . دوران حاضر از اواخر قرن نوزدهم شروع مي شود و خصوصيت عمده آن گسترش اصول نظري و موارد استعمال عملي آمار درهمة علوم و فنون است .

III) پايه گذاري آمار و رياضي :
تئوري احتمالات نه تنها مبناي اصولي علم آمار است . به طوري كه در مقدمه ذكر شد – بلكه مقدمة تاريخي اين علم را نيز تشكيل مي دهد . حساب احتمالات از مطالعة فرايندهاي تصادفي مانند بازي با ورق و تاس نرد و نظاير اينها شروع شده است .

توجه به اينگونه فرايندها و علاقه به پيشگويي پيشامدهاي برگزيده در بازيهاي تصادفي ( مثلاً ورق برنده يا خال معين از تاس نرد و مانند اينها ) البته هميشه وجود داشته است ، ولي گمان نمي رود كه قبل از بازگشت ( رنسانس ) علمي در اروپاي قرن شانزدهم و هفدهم دربارة اصول نظري احتمال مطالعة منظم كرده شده باشد. در آثار چند تن از دانشمندان ايتاليايي قرون پانزدهم و شانزدهم مانند پاچيولو و فونتانا معروف به تار تاگليا و مخصوصاً كاردانو و گاليله مطالعاتي در محاسبة احتمال پيشامدهاي تصادفي وجود دارد .

وي تحقيقات استقرايي و نظري منظم درباره فرايندهاي احتمالي در قرن هفدهم ، و تأليف اصول و قواعد رياضي حساب احتمالات واقعاً در قرن هفدهم و هجدهم صورت گرفته است . پاسكال و فرما دو دانشمند فرانسوي به خواهش يكي از اشرافيان فرمان به احتمال برد و باخت در بازي هاي تصادفي راغب شده بودند . قواعد اساسي احتمال پيشامدهاي ساده و مركب را اين دو وضع كرده اند . از آن جمله قاعده تشكيل « مثلث پاسكال » يا د« مثلث حسابي » است كه به وسيلة آن مي توان احتمال دو پيشامد p و q را در تركيبات n تايي به دست آورد . روش پاسكال در اين مطالعات يك روش نيمه استقرايي ( هندسي ) و نيمه انتزاعي ( رياضي ) بود . دانشمندان ديگري اصول و قواعد حساب احتمالات را به صورت كامل تر تدوين كرده اند . برنويي و نيوتن از آن جمله اند . توزيع دو جمله اي نيوتن روش كلي حساب احتمالات پيشامدهاي q و p در تركيبات n تايي را به دست مي دهد و در واقع قاعده كلي تشكيل مثلث پاسكال را بيان مي كند . پيش از نيوتن ، وييت و بريگز به توزيع دو جمله اي پي برده بودند . اما نيوتن راه حل جبري مسئله را نشان داد و آن را به حالت هايي با n منفي و كسري تعميم داد . دو مواور در تحقيقي راجع به حالت هاي كلي دو جمله اي نيوتن به كشف فرمول منحني خاصي كه بعداً منحني طبيعي ناميده شد موفق گرديد .

فصل دوم : شمردن و سنجيدن
I) داده هاي آزمايشي و انواع آن :
داده هاي عددي كه در محاسبه و تحليل آماري مورد استفاده قرار مي گيرند عموماً بر دو نوعند : فراواني ها و اندازه ها . يك حالت تبديل پديده هاي مورد تحقيق به اعداد آن است كه تعداد آنها را بشماريم . ارقامي كه بدين ترتيب به دست مي آوريم فراواني خوانده مي شوند . مثلاً اگر عده شاگردان يك دبستان را بر حسب پايه تحصيلي هر يك بشماريم فراواني شاگردان پايه هاي مختلف را به دست خواهيم آورد . فراواني نشان مي دهد هر حالت يا نوع از پديده اي در جمعيت يا نمونه مورد تحقيق چند بار وجود دارد . نوع ديگر داده هاي عددي كه اندازه ناميده مي شود بيشي يا كمي يك حالت يا شيء را بر حسب يك مقياس اندازه گيري نشان مي دهد . مثلاً اگر به جاي شمردن عده شاگردان هر پايه ، سن يا مهارت خواندن و نوشتن يا بهره هوشي هر شاگرد را معين كنيم عمل سنجش يا اندازه گيري انجام داده ايم . اعدادي كه از سنجش پديده اي حاصل مي شود بيش يا كمي آن پديده را نشان مي دهند . براي سنجيدن هر چيز به مقياس سنجش يا اندازه گيري مناسبي نيازمنديم و اعدادي كه با انيعمل به دست مي آوريم كميت يا كيفيت پديده را بر حسب آن مقياس معين مي كنند . روش هاي آماري با هر دو نوع داده هاي عددي يعني شماره ها و اندازه ها سروكار دارند .

II) فراواني – درصد :
عده افرادي كه در هر طبقه قرار مي گيرند فراواني آن طبقه ناميده مي شوند . اگر از شاگردان يك كلاس ۲۵ نفري ۱۸ نفر در آزمايشي قبول شوند و ۷ نفر رد شوند ، فراواني طبقه قبول شدگان ۱۸ و فراواني طبقه رد شدگان ۷ مي باشد فراواني ، يك داده آماري خام به شمار مي آيد . در بررسي آماري آن را به مقادير ديگري تبديل مي كنيم كه وضع هر طبقه را روشن تر بيان مي كند . از جمله اين مقادير مي توان درصد را نام برد .

براي توضيح بيشتر اين مطلب به جدول مطابق نمونه توجه كنيد . اين جدول از تحقيقي دراعتبار امتحان ورودي دانشگاههاي ايران در سال ۱۳۴۳ برداشته شده است . براي مقايسه نتيجه امتحان ورودي داوطلبان با وضع تحصيل آنان در پايه دوازدهم ، نمونه اي به تعداد ۳۴۳۶ تن از داوطلبان ورودي عمومي دانشگاههاي ايران در سال ۱۳۴۳ انتخاب شده اند . اين نمونه تقريباً عده كل داوطلبان امتحان ورودي آن سال را تشكيل مي دهد. سپس عده انتخاب شده از لحاظ معدل كل ديپلم دبيرستان به ۵ دسته طبقه بندي مي شوند كه به شرح زير است :

بسيار ضعيف ( كساني كه معدل كل ديپلم آنان بين ۰۰، ۱۰ و ۱۱،۹۹ است )
ضعيف ( كساني كه معدل كل ديپلم آنان بين ۰۰ ، ۱۲ و ۱۳،۹۹ است )
متوسط ( كساني كه معدل كل ديپلم آنان بين ۱۴،۰۰ و ۱۵،۹۹ است )
خوب ( كساني كه معدل كل ديپلم آنان بين ۱۶،۰۰ و ۱۷،۹۹ است )
بسيار خوب ( كساني كه معدل كل ديپلم آنان بين ۱۸،۰۰ و ۱۹،۹۹ است )

آنگاه عده قبول شدگان و رد شدگان در هريك از اين پنج طبقه شمرده شده است چنان كه در جدول ۲ خواهيد ديد .

جدول ۱- عده قبول شدگان و رد شدگان نمونه اي از داوطلبان امتحان ورودي عمومي دانشگاههاي ايران در سال ۱۳۴۳ ، بر حسب معدل كل ديپلم دبيرستان آنان .

نتيجه امتحان ورودي بسيار ضعيف ضعيف متوسط خوب بسيار خوب جمع
قبول شده ۲۰ ۶۲ ۱۱۷ ۱۵۲ ۴۶ ۳۹۷
رد شده ۴۵۸ ۱۱۴۵ ۱۱۰۲ ۳۲۲ ۱۲ ۳۰۳۹
جمع ۴۷۸ ۱۲۰۷ ۱۲۱۹ ۴۷۴ ۵۸ ۳۴۳۶
درصد قبول شدگان ۲/۴ ۱/۵ ۶/۹ ۱/۳۲ ۳/۷۹ ۶/۱۱

دستور محاسبه درصد :
تعريف و روش محاسبه درصد با استفاده از نشانه هاي آماري به اين صورت بيان مي شود : اگر فراواني كل طبقه را N و فراواني گروه خاصي را كه مي خواهيم درصد آن را نسبت به فراواني كل طبقه حساب كنيم f و درصد را P نشان دهيم . بر حسب تعريف دستور فوق به دست مي آيد .
مثلاً : در جدول ۱ درصد قبول شدگان در طبقه ( بسيار خوب ) چنين محاسبه مي شود .

به همين مقياس درصد قبول شدگان در طبقه ( بسيار ضعيف ) مساوي است با :
%
علامت درصد چنين است : % . اين علامت درست راست مقدار درصد قرار مي گيرد مانند نمونه هاي ذكر شده در بالا .

فصل سوم : توزيع فراواني
I) جدول هاي توزيع فراواني :
جدولي كه داده هاي عددي را هنگام آزمايش بر آن ثبت مي كنيم جدول داده ها خواهيم ناميد . در اين جدول داده ها به صورتي كه با روش يا موضوع آزمايش نسبت مناسب داشته باشد ثبت مي شوند . مثلاً : نمره هاي عده اي را كه در يك جدول بوده و در آزمايشي شركت كرده بودند به ترتيب اجراي آزمايش يا به ترتيب الفباي نام آزمايش شدگان يا به ترتيب تصحيح و نمره گذاري ورقه آزمايش در جدول وارد مي كنيم . اين جدول داراي دو ستون است كه در يكي نام آزمايش شدگان و يا علامتي كه آنها را مشخص مي كند و در ديگري نمره آزمايش شدگان را مي نويسيم . جدول ذكر شده يك آزمايش استعداد يكيرا كه ۵۰ تن در آن شركت كرده اند به اين صورت نشان مي دهد . در جدول ۲ آزمايش شدگان به ترتيب اعداد ۱ تا ۵۰ مشخص كرده ايم .

تنها فايده اي كه از اين جدول مي توانيم برد اين است كه در اين آزمايش عدد ۵۵ ( مربوط به آزمايش شده بيست و ششم ) بيشترين و نمره ۱۰ ( مربوط به آزمايش بيست و چهارم ) كمترين نمره هاست و نيز از اين حد بالا و حد پايين مي توانيم پي ببريم كه دامنه كلي تغييرات نمره ها چقدر است . يعني نمره هاي آزمايش شده در چه فاصله اياز مقياس نمره گذاري واقع شده اند .
II) مشخص كردن تعداد طبقات و فاصله طبقات :

معمولاً تعداد طبقات را بين ۵ تا ۲۰ طبق در نظر مي گيريم و براي مشخص كردن تعداد طبقات و فاصله طبقات از روابط زير استفاده مي شود .
IV) مشخص كربن شروع طبقه بندي :
شروع طبقه بندي با كوچكترين اندازه يا داده كه در عين حال بر فاصله طبقات نيز بخش پذير باشد آغاز مي گردد .
مثال ) : اگر كوچكترين داده ۶۳ و فاصله طبقات ۸ باشد شروع طبقه با ۵۶ مي باشد .

IV) مشخص كردن فراواني هر طبقه :
براي اين كار كافي است تعداد خط نشانه هاي هر طبقه را شمرده جلوي آن يادداشت كنيم.
مثال ) : داده هاي زير مربوطند به نتيجه اندازه گيري استعداد رياضي ۳۰ نفر از دانش آموزان كلاس . اين داده ها را با فاصله طبقاتي ۳ طبقه بندي كرده و در جدول ۳ نشان مي دهيم . و جدول توزيع و فراواني آن را مشخص مي نماييم .

– ۲/۲۲ – ۲۸- ۱۴- ۵/۷ – ۲۰- ۳۱- ۲۶- ۵/۲۸ : داده ها عبارتند از
۱۵- ۱۸- ۳۱- ۶/۲۹ – ۲/۱۹ – ۱۷- ۵/۲۰ – ۷/۲۶
۳۲- ۲۶- ۱۸- ۱۴- ۲۰- ۳۷- ۳۱- ۲۶- ۵/۲۱- ۸
۷- ۲۸- ۵/۳۰- ۵/۲۸

R = ( 37-8 ) +1 = 30 K =
جدول ۳- توزيع فراواني استعداد ۳۰ نفر از دانش آموزان

L خط نشان داده ها
۱ ۳۸- ۳۶
۰ ۳۵ – ۳۳
۶ ۳۲ – ۳۰
۵ ۲۹- ۲۷
۳ ۲۶ – ۲۴
۲ ۲۳ – ۲۱
۶ ۲۰ – ۱۸
۲ ۱۷ – ۱۵
۲ ۱۴ – ۱۲
۰ ۱۱- ۹
۲ ۸ – ۶

جدول ۲- داده هاي عددي آزمايش استعداد كلي كه در گروه ۵۰ نفري انجام گرفته است

آزمايش شونده

نمره
آزمايش شونده
نمره
آزمايش شونده
نمره
آزمايش شونده
نمره
آزمايش شونده
نمره
۱ ۲۸ ۱۱ ۳۳ ۲۱ ۲۷ ۳۱ ۳۷ ۴۱ ۳۳
۲ ۲۹ ۱۲ ۲۱ ۲۲ ۵۱ ۳۲ ۳۶ ۴۲ ۲۹
۳ ۳۲ ۱۳ ۲۲ ۲۳ ۲۰ ۳۳ ۳۶ ۴۳ ۴۲
۴ ۱۴ ۱۴ ۳۴ ۲۴ ۱۰ ۳۴ ۳۳ ۴۴ ۲۷
۵ ۱۶ ۱۵ ۲۴ ۲۵ ۱۷ ۳۵ ۲۶ ۴۵ ۲۱
۶ ۳۹ ۱۶ ۴۰ ۲۶ ۵۵ ۳۶ ۳۵ ۴۶ ۲۵
۷ ۲۸ ۱۷ ۲۹ ۲۷ ۲۲ ۳۷ ۴۴ ۴۷ ۳۴
۸ ۴۷ ۱۸ ۲۵ ۲۸ ۴۱ ۳۸ ۱۵ ۴۸ ۳۳
۹ ۱۸ ۱۹ ۱۶ ۲۹ ۴۶ ۳۹ ۲۷ ۴۹ ۱۵
۱۰ ۲۷ ۲۰ ۲۴ ۳۰ ۱۹ ۴۰ ۱۹ ۵۰ ۴۶

V) مشخص كردن نماينده طبقات (( عدد مياني )) xi :
از روابط زير بدست مي آيد : ۲/ ( حد بالاي طبقه + حد پايين طبقه )xi =
اختلاف نماينده طبقات در هر جدول برابر است با فاصله طبقات آن جدول .

VI) كرانه طبقات :
حدود واقعي هر طربقه از ۵/۰ واحد كمتر و تا ۵/۰ واحد بيشتر است . مثلاً حدود واقعي ۱۲ برابر است با ۵/۱۱ و ۵/۱۲ .
در جدول هايي كه به صورت پيوسته تنظيم مي شوند حدود طبقات و كرانه طبقات با هم يكي هستند .

شيوه طبقه بندي فراورده هاي ناپيوسته :
در مورد داده هاي ناپيوسته كافيست نخست طبقات را مشخص نموده آنگاه فراواني هر طبقه را تعيين نماييم و سپس جدول مربوطه را رسم كنيم .

انواع فراواني :
۱) فراواني مطلق (f) : ازطريق شمارش خط نشانه ها صورت مي گيرد
۲) فراواني نسبي (F) : Fi =
3) فراواني تجمعي يا (fc) : برابر است با فراواني مطلق آن طبقه + مجموع فراواني هاي طبقه ما قبل . fci = f1 + f2 + …. + fi
4) فراواني درصد تجمعي (Pc) :
معناي درصد فراواني تجمعي آن است كه چند درصد افراد كمتر از كرانه بالاي آن طبقه قرار دارند و جمع فراواني نسبي بايد يك شود .

رسم نمودارها :
I) نمودارهاي مربوط به متغيرهاي پيوسته :
۱- نمودار خطي يا چند ضلعي
۲- نمودار هيستوگرام
۳- نمودار فراواني تجمعي
۴- نمودار درصد فراواني تجمعي

II) نمودارهاي مربوط به متغيرهاي ناپيوسته :
۱- ستوني
۲- دايره اي
۳- آديك
۱- طريقه رسم نمودار خطي :
۱- مشخص كردن نماينده طبقات .
۲- مدرج كردن محورها : محور افقي را برابر با تعداد طبقات و محور عمودي را برابر با بزرگترين فراواني مطلق طبقات مدرج مي كنيم آنگاه با توجه به نماينده هر طبقه و فراواني آن طبقه ۲ نمودار از دو محور خارج مي كنيم تا يكديگر را قطع كنند . از به هم رسيدن اين نقاط نمودار خطي حاصل مي گردد .

۲- مراحل رسم نمودار هيستو گرام :
۱- مشخص كردن كرانه طبقات
۲- مدرج كردن محورها : روي محور افقي كرانه طبقات و روي محور عمودي فراواني طبقات يادداشت مي شود آنگاه از كرانه پايين و بالاي هر طبقه مستطيل يا ستوني خارج مي كنيم كه وسط آن برابر با فراواني آن طبقه مي باشد .
۳- مراحل رسم نمودار فراواني تجمعي :
۱- مشخص كردن كرانه تبليغات .
۲- مدرج كردن محورها : محور افقي را براي نمايش كرانه طبقات و محور عمودي را براي مشخص كردن فراواني تجمعي طبقات مدرج مي كنيم . آنگاه از كرانه بالاي طبقات يك عمود و از فراواني تجمعي آن طبقه نيز عمودي ديگر از ۲ محور خارج مي كنيم تا يكديگر را قطع كنند . اتصال اين نقاط به يكديگر نمودار فراواني تجمعي است .
۴- مراحل رسم نمودار درصد فراواني تجمعي :
همان مراحل رسم نمودار فراواني تجمعي را طي مي كند با اين تفاوت كه محور عمودي را همواره به صد قسمت تقسيم مي كنيم به كمك اين نمودار مي توان رتبه درصدي افراد را مشخص كرد و بر عكس .

۵- مراحل رسم نمودار ستوني يا ميله اي :
روي محور افقي طبقات را با فواصل يكسان ولي جدا از هم مشخص مي نماييم ( فاصله بين ستوني بايد نصف عرض ستوني باشد ) و روي محور عمودي فراواني ها را مشخص مي نماييم آنگاه براي هر طبقه يك ستون يا استوانه خارج مي كنيم كه دسته بندي آن برابر با فراواني آن طبقه مي باشد .

۶- مراحل رسم نمودار دايره اي :
۱- مشخص كردن درجات مربوط به هر طبقه با استفاده از تناسب با ۳۶۰ مي باشد .
۲- رسم يك دايره به دلخواه و تقسيم سطح آن به نسبت درجات هر طبقه به كمك نقاله
۳- مشخص كردن درصد مساحت هر طبقه به كمك تشكيل تناسب با سطح يا رابطه