پروژه امار جامعه کل دانش اموزانی که کتاب امار و احتمال را مطالعه کرده اند

اي خواجه مكن تا تواني طلب علم كاندر طلب دانش پر روزي بماني
رو مسخرگي پيشه كن و مطربي آموز تا دد خود از مهتر كهتر سازي

مقدمه
آموزش پرورش قصد دارد ميزان سواد دانش‌آموزان وضعيت تحصيلي آنان و تعداد قبول‌شدگان در يكي از سنوات تحصيلي را بدانند و با استفاده از آنان تعدادي كتب كسر يا اضافه نمايند و يا برنامه‌ريزي ديگري را تنظيم نمايند تا ميزان سواد دانش‌آموزان ارتقا يابند. بدين‌منظور رئيس وقت آموزش و پرورش طبق بخشن نامه‌هاي مختلف به هر يك از واحدهاي تاليف كتب درسي از آنان خواست كه در مورد وضعيت كساني كه به آنها كتب تدريس مي شود و نيز ميزان مرغوبيت آنان تحقيق كنند.

روشهاي جمع‌آوري داده‌ها:
بسياري از گروه‌هایي كه روش درست تحقيق را نمي‌دانستند در اين مهم باز ماندند و گروه آمار تحقيقات خود را آغاز كرد. اين گروه ابتدا جامعه را معرفي نمود.
((جامعه كل دانش‌آموزاني است كه اين كتاب را مطالعه مي كنند.))

با توجه به كثرت جامعه و هزينه سر سام آور وقت گير بودن نمي توانستند سر شماري كنند بس تصميم ديگري گرفتند. يكي از اعضا پيشنهاد كرد كه از دانش آموزان تهران نمونه گيري كنند كه مورد موافقت سر گروه واقع نشد سر رگروه دلايل خود را براي رد اين در خواست چنين اعلام كرد :
۱- دانش آموزان تهراني به دليل اينكه داراي امكانات فراواني هستند وضعيت تحصيلي آنان بسيار بهتر ازمناطق محروم نقاط كشور است .

۲- دانش آموزان به صورت تصادفي انتخاب نشده اند و ممكن است نمودار آنها با نموداري كه مي خواهند بدست آورند فرق داشته باشد .
سر گروه اعلام كرد كه كل شهرهاي ايران را روي كاغذ بنويسند و از اين شهرها ۱۰۰شهررا بصورت قرعه كشي و كاملا تصادفي انتخاب نمايند سپس اسم مدارس اين شهرها را نيز به روي كاغذ آورند و۱۰۰ دبيرستان را به صورت تصادفي انتخاب نمايندو سپس اسم هر يك از دانش آموزان آن مدارس را بنويسند و از آن صد دانش آموز انتخاب نمايند و نمرات آنها را مورد برسي قرار دهند و با ابنكه اسم كليه دانش آموزاني كه به آنها كتاب آمار به آنها تدريس شده است روي كاغذ نوشته شود و۱۰۰دانش آموزانتخاب شوند اكثريت اعضا به روش دوم راي دادند .

اسم كليدي دانش آموزان را روي كاغذ نوشته و ۱۰۰دانش آموز را انتخاب نمودند نمرات اين دانش آموزان به شرح زير است .

۱۹ ۱۵ ۱۸ ۱۷٫۷۵ ۱۶٫۵ ۱۴٫۵ ۱۵٫۲۵ ۲۰ ۱۶ ۱۹٫۷۵
۱۸٫۷۵ ۱۹ ۲۰ ۱۴ ۲۰ ۱۹ ۱۰٫۲۵ ۱۱٫۷۵ ۱۳ ۲۰
۱۸ ۲۰ ۱۵ ۱۶ ۱۸ ۱۸ ۱۹ ۲۰ ۲۰ ۲۰
۱۸ ۱۹ ۱۹ ۱۹٫۷۵ ۲۰ ۱۷ ۱۹ ۱۴٫۵ ۱۴ ۱۲
۲۰ ۲۰ ۲۰ ۱۸٫۵ ۲۰ ۱۹ ۱۰ ۱۲٫۷۵ ۱۰٫۲۵ ۱۸

۱۸ ۱۹٫۵ ۲۰ ۲۰ ۱۷٫۷۵ ۱۷٫۷۵ ۱۷٫۵ ۱۴ ۱۵٫۵ ۱۴
۱۷ ۱۵ ۱۶ ۱۴ ۱۹ ۱۰٫۲۵ ۱۲٫۵ ۱۴ ۱۶ ۱۷
۱۳ ۱۲ ۱۰ ۱۱ ۱۹٫۲۵ ۱۷ ۱۹ ۲۰ ۲۰ ۱۸
۲۰ ۲۰ ۱۸ ۲۰ ۲۰ ۱۸ ۱۸ ۲۰ ۲۰ ۲۰
۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰
ِ
اين عددها يا به عبارتي دادها با استفاده از داده هاي از پيش تهيه شده بدست آمده است
سپس اين گروه به مرور هدف پرداخت وضعيت دانش آموزان درس آمار و خود سازي و نيز تعداد دانش آموزاني كه نمره بالاي ۱۵ آورده اند.

با وجود اين مطلب دادهها را دسته بندي كردند و نوع داد ها را مشخص نمودند وضعيت دانش آموزان در متغیر كيفي و ترتيبي بود و تعداد دانش آموزاني كه بالاي ۱۵ نمره اخذ نموده‌اندو نیزكمي پیوسته است. يكي از اعضا به اين متغير ها اعتراض كردند و مدعي شد كه سر گروه اشتباه كرده است.

سر گروه در پاسخ به او چنين گفت وضعيت دانش آموزان قابل شمارش نسبت به متغير ها كيفي است و نيز اگر داده ها را از كوچك به بزرگ مرتب كنيم نوعي ترتيب طبيعي بين داده ها بوجود مي آيد و آن اين است كه داده ها از كوچك به بزرگ مرتب شده اند در مورد تعداد دانش آموزاني كه بالاي ۱۵نمره گرفته اند نيز بايد بگوييم كه تعداد دانش آموزان قابل شمارش است پس متغير كمي استي و نيز اينكه اين متغيرها پيوسته نيز است زيرا علاوه بر ۱۷ ۱۸ ۱۷٫۲۵ ۱۷٫۵ ۱۷٫۷۵ را نيز در بر مي گيرد .

با توجه به پاسخ سر گروه آن فرد قانع شد.

در ادامه سر گروه از يكي از اعضا خواست كه داده ها را از كوچك به بزرگ مرتب كند و نيز اين كار را كرد .

۱۲٫۵ ۱۲ ۱۲ ۱۱٫۷۵ ۱۱ ۱۰٫۲۵ ۱۰٫۲۵ ۱۰٫۲۵ ۱۰ ۱۰
۱۴٫۵ ۱۴ ۱۴ ۱۴ ۱۴ ۱۴ ۱۴ ۱۳ ۱۳ ۱۲٫۷۵
۱۶ ۱۶ ۱۶ ۱۶ ۱۵٫۵ ۱۵٫۲۵ ۱۵ ۱۵ ۱۵ ۱۴٫۵
۱۸ ۱۷٫۷۵ ۱۷/۷۵ ۱۷٫۵ ۱۷٫۲۵ ۱۷ ۱۷ ۱۷ ۱۷ ۱۶٫۵
۱۸ ۱۸ ۱۸ ۱۸ ۱۸ ۱۸ ۱۸ ۱۸ ۱۸ ۱۸
۱۹ ۱۹ ۱۹ ۱۹ ۱۹ ۱۹ ۱۹ ۱۹ ۱۸٫۷۵ ۱۸٫۵
۲۰ ۲۰ ۲۰ ۲۰ ۱۹٫۷۵ ۱۹٫۷۵ ۱۹٫۵ ۱۹٫۲۵ ۱۹ ۱۹
۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰
۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰
۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰ ۲۰

سپس فراواني مطلق داده ها را بديت آوريد به عنوان مثال داده ۲۰/۳۴ بار تكرار شده است پس مي شود :x2=34 و بقيه داده ها را اين چنين بدست مي آوريم.

f12= 2 f17.5=1 f11=1 f10.25=3 F10=2
F14.5=2 F14=6 F13= 2 f12.75=1 F12.5=1
F16.5=1 F16=4 F15.5=1 F15.25=1 F15=3
F17.75 2 F17.5=1 F17.25=1 F17=4

F19=10 F18.75=1 F18.5=1 F18=11
F20=34 F19.75=2 F19.5=1 F19.25=1

دسته بندي
اولين اقدامي كه در مطالعه يك جامع بر اسا سداده ها انجام ميدهيم آن است كه ببينيم آيا مي توان جامعه را به چند دسته جدا تفكيك كرد د رمطا لعه متغيرهاي گسسته جدول فراواني بدون دسته بندي كار آمد است ولي اگر متغير پيوسته باشد اين روش براي منظم كردن داده هاي عملي نيستلذا براي تنظيم داده ها در اين قبيل موارد مراحل زير را طي مي كنيم .

دامنه تغيرات:
اولين نكته‌اي كه در اين مرحله مدنظر قرار مي‌گيرد، آن است كه ببينيم آيا متغير در فاصله زيادي تغيير مي‌كند يا درفاصله كمي قرار مي‌گيرد. طول بازه‌اي را كه متغير در آن تغيير مي‌كند، دامنه تغييرات مي‌گوييم.براي بيان روشن‌تر، فرض كنيد:
كوچك‌تريين داده = a‌ و بزرگترين داده = b
در اين صورت تفاضل a‌ از b يعني b-a را دامنع تغييرات مي‌گويند و با علامت R نشان مي‌دهيم.
R = b – a
بزرگي دامنه‌ي تغييرات نشان‌دهنده‌ي تفاوت زياد در جامعه است. هرچقدر اين دامنه كمتر باشد، افراد جامعه از لحاظ اين متغير به هم نزديك‌ترند. اگر دامنه‌ي تغييرات صفر باشد، تمام افراد با هم برابر و يكسانند.
دامنه تغييرات را بدست مي آوريم
R = b – a R = 20 – ۱۰ = ۱۰
سپس با فرمول كه در آنR دامنه تغييرات C طول دسته و k تعداد دسته است. جدول فراواني را مي خوانيم كه به ۵ دسته تقسيم كنيم در نتيجه داريم:

پس از اينكه طول دسته‌ها را بدست آورديم، از كران پايين به اندازه طول دسته انتخاب مي‌كنيم و تا كران بالا ادامه مي‌دهيم كه در نتيجه‌ي آن طول دسته‌هاي ما مي‌شود.
۱۰-۱۲, ۱۲-۱۴, ۱۴-۱۶, ۱۶-۱۸, ۱۸-۲۰

مركز دسته
براي دسته‌ي [ai , bi ]، ai را كران پايين و bi را كران بالا و xi را مركز آن دسته مي ناميم و از رابطه زير بدست مي آوريم:

به همين ترتيب مركز ۵دسته بالا را بدست مي‌آوريم. داريم:

فراواني مطلق:
پس از بدست آوردن مركز دسته ها فراواني مطلق هر دسته را نيز بدست مي آوريم
مهدي = F5 مهدي = F4 مهدي = F3 مهدي = F2 مهدي = F1
F5=61 F4=13 F3=13 F2= 6 F1=7

ملاحظه مي شود كه %۷ داده ها در دستهي اولو%۶داده ها در دستهاي دوم %۱۳ درصداز داده ها را در دسته چهارم و%۶۱ از داده ها در دستهي پنجم قرار دارند.

فراواني نسبي:
اگر f1 فراواني دسته اي باشد و تعداد داده ها n باشد كسر را فراواني نسبي داده مي گوييم فراواني نسبي هر يك از داده‌ها را بدست مي‌آوريم

پس از آن درصد فراواني نسبي را بدست مي‌آريم.

اگر هر كدام را به ۱۰۰ ضرب كنيم، درصد فراواني نسبي به دست مي‌آيد. داريم:

ملاحظه مي شود كه درصد فراواني نسبي با درصد فراواني مطلق برابر است

فراواني تجمعي :
فراواني تجمعي هر دسته برابر است تعداد اشيايي كه مقدار آنها از كران آن دسته كمتر است.
فراواني تجمعي هر دسته را بدست مي آوريم:

جدول فراواني ها طي مراحل فوق بدست مي آوريم:
فراواني تجمعي درصد فراواني نسبي فرواني نسبي فراواني مطلق مركز دسته طول دسته
۷ ۷% ۰۷/۰ ۷ ۱۱ ۱۲-۱۰
۱۲ ۶% ۰۶/۰ ۶ ۱۳ ۱۴-۱۲
۲۶ ۱۳% ۱۳/۰ ۱۳ ۱۵ ۱۶-۱۴
۳۹ ۱۳% ۱۳/۰ ۱۳ ۱۷ ۱۸-۱۶
۱۰۰ ۶۱% ۶۱/۰ ۶۱ ۱۹ ۲۰-۱۸
۱۰۰% ۱ ۱۰۰ جمع

نمودارها و تحليل داده ها :
نمودار ميله‌اي

نمودار مستطيلي

نمودار چندبر فراواني

نمودار دايره‌اي

شاخص هاي مركز:
۱- مد: دادهاي است كه بيشترين با ر تكرارشده است در مراحل قبلي فراواني هر داده را بدست مي آوريم. حال با استفاده از آنها مي خواهيم كه مد را پيدا كنيم مد دادهي۲۰است كه به ميزان ۳۴ بار تكرار شده است.
۲- ميانه: پس از مرتب كردن داده ها مقداري را كه تعداد داده ها بعد از آن با مقدار داده ها قبل از آن برابر استميانه مي ناميم ميانه را از فرمول بدست مي آوريم كه در آن Md ميانه و N تعداد داده هاست.

سر گروه با بيان اين مطلب از يكي از همكاران خانم خواست كه ميانه را بدست آور وي نيز اين كار را نمود پس نوشت كه جواب ۵۰٫۵ آمد خانم همكار دو يا سه چهار با ميانه را بدست آورد و در هر با جواب ۵۰٫۵ مي آمد سپس او كه مي دانست داده اي به نام ۵۰٫۵ ندارد اعلام داشت كه از به دست آوردن ميانه عاجز استسر گروه با تشويق به وي گفتكه عمليات وي كاملا صحيح بوده و جواب بدست آمده كاملا صحيح است.

اين گفته سر گروهموجب تعجب اعضاء گروه شد. خانم همكار از سر گروه پرسيد كه اين امر چگونه ممكن استما داده اي به شماره ۵۰٫۵ نداريم سر گروه در پاسخ وي گفت: ((اگر تعداد داده هاي ما فرد باشد دادهاي كه بدست مي آيد به صورت يك عدد طبيعي مضرب يك است و آن داده ميانه است اگر داده ها زوج باشد جواب معادله n/5 مي آيد كه n يك عدد طبيعي است براي بدست آوردنميانه در اين موارد ميانگين رو دادهاي كه در وسط است ميانه مي باشد پس ميالنگين دو دادهاي x50 و x51 ميانه است.))

با توجه بك گفته سر گروه خانم همكار دو باره ميانه را بدست آورد كه در نتيجه آن عدد۱۸٫۲۵ ميانه است.

نمودار جعبه اي
با كفتن اين اسم همهاعضاء گروه به فكر جعبهميوه افتادنند يكي از اعضاءاز سر گروه پرسيد كه با جعبه سيب چه نموداري مي توان درست كرد ؟سر گروه خندهاي كرد در پاسخ گفت: از نمودارهايي كه تا كنون خوانده‌ايم، هركدام به طريقي داده‌ها را نمايش مي‌دادند. فكر مي‌كنيد كدام نمودار بهتر از بقيه پراكندگي داده‌ها را نشان مي‌دهد؟

چارك
ميانه نيمه اول داده را چارك اول (Q1) و ميانه نيمه دوم داده ها را چارك سوم (Q3) مي ناميم. در ضمن چارك دوم همان ميانه است.
سرگروه در ادامه افزود ((نمودار جعبهاي نمودار تصويرياست كه داده ها را بر اساس پنج مقدار نمايش مي دهد اين مقادير عبارتند از
۱-كوچكترين داده
۲- چارك اول

۳-ميانه
۴- چارك سوم
۵- بزكترين داده…
سپس براي درك بيشتر اعضا نمودار ساده رسم كرديم.

ميانگين
براي محاسبه ميانگين همه داده ها را بايد جمع كرد ه بر تعداد كل داده ها تقسيم مي كنيم يعني:
قضيه: اگر X ميانگين X1…….Xn باشد آن گاه مجموع اختلافات داده ها از ميانگين برابر است با صفر
اثبات

زيرامي دانيم مجموع مقاديربرابر حاصل ضرب ميانگين در تعداد آن ها است يعني:

در برخي از محاسبات ممكن است اعداد بسيار بزرگ باشد جمع كردن اين اعداد و تقسيم آن ها همراه با خطاهايي خواهد بود شايد بگوييد در عصر رايانه ها بزرگي اعداد مشكلي نخواهد بود. ولي به هر حال اين اعداد را بايد به طريقي وارد كنيم كه در اين مرحله بزرگي انها اشكالاتي را ايجاد خواهد كرد.اگر بتوانيم تدبيري بينديشيم تااز اعدادكوچكتر استفاده كنيم اين مشكل را دور زده ايم.قضيه زير راه حل مناسب اين مسئله را ارائه مي كند.

مقايسه ميانگين و ميانه:
ميانگين شاخص خوبي براي نشان دادن مركزيت داده هاست در بعضي از مسائل اين شاخص نمي تواند مؤثر باشد.مثلا انتظار ميرود در يك كلاس تمامي دانش اموزان نمره خوبي بگيرند. اگر نمرات خوب باشد مسلما ميانگين هم بالا خواهد بود ولي آيا بالا بودن ميانگين نمرات نشان دهنده وضع خوب كلاس است .ممكن است تعداد كمي نمره۲۰گرفته باشند وتعداد زيادي نمره ۱۰ يا ۱۲٫ وضع اين كلاس رضايت بخش نخواهد بود براي آنكه وضع كلاس را بتوانيم خوب ارزيابي كنيم حداقل نصف كلاس بايد نمره خوبي آورده باشند.

آن چه نمره اي است كه نمره نصف دانش آموزان كلاس از آن بيش تر است ؟
_اگر ميانه خيلي از ميانگين كو چكتر باشد تعبير آن است ؟
_اگر ميانه خيلي بزرگ تر از ميانگين باشد تعبير آن است؟

میانگین وزن دار
سرگروه با گفتن این عنون موجب خنده ی اعضای گروه شد ویکی از جایش بلند شد وگفت میانگین وزنی علی آقا ۲۵۰ کیلو است وهمه خندیدند . سر گروه اعضا را دعوت به سکوت کرد وگفت : برای محاسبه میانگین وزنی در حالت کلی فرض کنید داده های Xn… ,X1 به ترتیب دارای ضرایب Wn… ,W1 این اطلاعات را برای سادگی می توانیم در جدول زیر خلاصه کنیم :

x1 x2 ….. xn داده‌ها
w1 w2 ….. wn ضريب (داده‌ها)

در این صورت میانگین داده های بالا با احتساب ضرایب مربوطه به صورت زیر محاسبه می شود:

ميانگين وزني

در مواردی که ما با میانگین وزن دار مواجه می شویم محاسبه میانگین در یک جدول فراوانی است . دیدیم که در یک جدول فراوانی قرار شد تمام افرادی که در یک دسته قرار دارند برابر مرکز دسته فرض کنیم. پس مرکز دسته به اندازه فراوانی آن دسته تکرار می شود ، واین مانند آن است که ما به مرکز دسته وزنی برابر فراوانی آن دسته داده باشیم ، پس اگر بخاهیم میانگین را حساب کنیم باید مرکز دسته ها را در فراوانی های نظیر ، ضرب وبا هم جمع کرده وپس از آن بر مجموع فراوانی ها (که همان تعداد داده هاست ) تقسیم کنیم .

این مفهوم میانگین برای محاسبات از روی جدول فراوانی مناسب تر است

شاخص های پراکندگی
۱- دامنه تغییرات
۲- انحراف میانگین
۳- واریانس
۴- انحراف معیار
۵- ضریب تغییرات

دامنه تغییرات :
در فصول قبل در این مورد بحث شد و برابر است با R=b-a دامنه تغییرات باشد
۲۰-۱۰=۱۰ R=

واریانس :
دامنه تغییرات شاخص مناسبی است . اما در تصمیم گیری های کلان از ارزش آماری زیادی برخوردار نیست . زیرا ما به شاخص هایی نیاز داریم که هم پراکندگی داده ها وهم فراوانی آنها را مد نظر قرار دهند.