طبيعت روشهاي آماري

در ذهن عمومي روشهاي آماري عبارت از جداولي است كه با اعداد سروكار دارند.بدين ترتيب روشهايي كه در جمع آوري و تجزيه و تحليل اعداد تجاري يا مبادلات دولتي بكار ميرود مربوط به رشته آمار ميشود.در هرحال اين تعريف كلي چندان مفيد بنظر نميرسد.از اين جهت لازم است قبل از اينكه روشهاي مذكور را بتوان بدرستي روشهاي آماري ناميد.طبيعت اعداد و علل مطالعه آنها را مشخص ومحدود نمود.

روشهاي آماري با اعدادي سروكار دارند كه با اندازه گيري يا شمارش مشاهدات از منبعي بدست آمده اند. بعنوان مثال،بمنظورمطالعه مخارج خدمات پزشكي يك شهر ميتوان درصد محدودي ازساكنين شهررا انتخاب كرد و درمورد مخارج پزشكيشان سؤالاتي نمود.و يا در بررسي نظرات مردم دربارة يك موضوع عمومي كه قراراست در كنگره مورد بحث قرارگيرد،تعدادي از رأي دهندگان در سراسر مملكت انتخاب خواهند شد و سؤالاتي دربارة موضوع مذكور عنوان مي شود.
به منظور تجزيه و تحليل جامعه مورد مطالعه،نمونه اي را مناسب با هدف به نحوي كه اخيرا ذكرگرديد آماردانان انتخاب مي نمايند. بدين معنا كه نتايج نمونهاي انتخاب شده را جهت تمام شهر تعميم داده مي شود.بطور مشابه ، هدف از سؤال كردن از درصد محدودي از رأي دهندگان دربارة يك موضوع عمومي عبارت است از تعيين تقريبي نظرات تمام رأي دهندگان دربارة آن موضوع است.
مجموعه مشاهداتي كه بمنظور بدست آوردن اطلاعاتي از يك منبع مشاهدات انتخاب مي شود «نمونه» نامند و آن منبع مشاهدات را «جامعه» گويند.با توجه به توضيحات داده شده «روشهاي آماري به روشهاي تجزيه وتحليل در موردجوامع با استفاده از نمونه ها اطلاق مي شود.» كلمه آمار اغلب به جاي روشهاي آماري بكار مي رود.
آن قسمت از روشهاي آماري كه به جمع آوري و خلاصه كردن اطلاعات مربوط مي شود معمولا «آمارتوضيحي» ناميده مي شود.و آن قسمت مربوط به تجزيه وتحليل و تفسيرنتايج اعداد و ارقام را « آمار توضيحي» ناميده ميشود و آن قسمت مربوط به تجزيه و تحليل و تفسير نتايج اعداد و ارقام را «آمار تفسيري» گويند.از آنجايي كه هدف نهايي تفسيركردن نتايج كه همان تجزيه و تحليل اعداد است مي باشد قسمت توصيفي مي بايست بصورت قسمت ابتدايي در نظر گرفته شود.به ميزان قابل توجهي در چهل سال اخير از روشهاي آماري در كليه علوم وفنون بخصوص درعلوم بيولوژي و علوم اجتماعي استفاده شده است .

با وجود اينكه روشهاي مهم نسبتا ساده اند و كاربرد آنها در رشته هاي مختلف يكسان هستند ولي مع الوصف به علت توجه فراوان روشهاي آماري به سرعت توسعه نمود و به پيچيدگي و تنوع آن افزوده گرديد.

توزيع احتمالات

توزيع فراواني نمونه عبارت از تخميني از توزيع فراواني جامعه مورد نظر است . درصورتي كه تعداد نمونه زياد باشد، ميتوانيم چنين انتظار داشته باشيم كه توزيع فراواني نمونه تقريب خوبي از توزيع فراواني جامعه مورد نظر است. مثلا در مطالعة وزن دانشجويان ساكن خوابگاه، اگرتعداد دانشجويان در خوابگاه ۸۰۰ نفر باشد و ما۴۰۰ دانشجو را انتخاب كرده باشيم، ميتوانيم انتظار داشته باشيم كه توزيع فراواني جامعه خيلي شبيه يكديگر باشند .
تعداد نمونه در مسايل آماري غالبا آنقدر كافي نيست كه توزيع جامعه را با دقت

كافي مشخص سازد. مع الوصف با اطلاعات حاصله از نمونه بعلاوه اطلاعاتي كه از منابع ديگر جمع آوري مي شود، شكل عمومي توزيع جامعه قابل پيش بيني است. توزيع احتمالات عبارت از مدل رياضي است براي توزيع واقعي يك فراواني مورد نظر است.

تجزيه واريانس

بدون شك يكي از مسايلي كه اغلب در كارهاي آماري با آن برخورد مي شود موضوع آزمون تفاوت نمونه است كه آيا از نظر آماري تفاوت دو نمونه نسبت به صفتي معنادار است يا خير؟ اين مساله با آزمون تساوي ميانگين دو جامعه يا تساوي نسبت در دو جامعه مطرح و حل مي شود.
دليل اينكه اين قبيل مسائل اغلب اتفاق مي افتد اين است كه پژوهشگران اكثرا آزمايشي را طرح مي كنندكه هدفشان مقايسه يك روش جديد است با يك روش معمولي.
مثلا ممكن است معلمي معتقد باشد روشي كه جهت زبانهاي خارجي پيدا كرد، بهتر از روش متداول است كه در گروه زبان تدريس مي گردد، و يا يك نفر شيميدان ممكنست يك نوع پلاستيك جديدي كشف كرده باشد كه از آن پلاستيكي كه در كارخانه اش ساخته مي شود مرغوبتر باشد. در هر يك از دو حالت نحوه آزمايش به اين ترتيب مطرح مي گردد كه آزموني انجام شود كه معلوم گردد روش جديد و پلاستيك جديد در واقع از روش قبلي يا پلاستيك قبلي بهتر است يا خير .
در هر حال، مقايساتي كه اغلب اتفاق مي افتد شامل چندين روش يا چندين نوع محصول مي

باشد به جاي مقايسه دو نوع .مثلا يك كارخانه كيك سازي با تغيير دادن مقاديرتشكيل دهنده كيك، شش نوع كيك توليد ميكندو مي خواهد از نظر كيفيت آنها را مقايسه نمايد. در اينگونه مسائل كار صحيحي نيست كه در هر دفعه دو نوع كيك مقايسه شوند. درمسأله اخيركه تعداد نمونه شش مي باشد در نتيجه تعداد مقايسات برابر با پانزده دفعه خواهد شد. از طرف ديگر احتمال در آزمون يك تفاوت با احتمال چند آزمون كه توأما انجام شود يكسان نخواهد بود. يكي ديگراز معايب مقايسه دو نمونه در هر دفعه ممكن است منجر به طرح آزمايشات نامطلوب شد كه دقيقا به هدف اصلي نايل نگرديد.مثلا كارخانه سازنده كيك ممكن است فقط يك عامل را درهرزمان تغيير دهد و در هر

دفعه در مقايسه دو كيك نوع بهتر را انتخاب نمايد و در اين صورت ممكن است يك نوع كيك بهتر را فراموش نمايد ولي اگرچند عامل موثر در مخلوط كيك را تغيير دهد و سپس كليه كيكها را توأما بررسي نمايد احتمال نرسيدن به هدف اصلي از بين خواهد رفت.
با توجه به مطالب ذكرشده به منظورحل مسائل چند متغيره به نظر ميرسد كه احتياج به روش جديدي است. يكي از اين روشها جهت حل مسائلي كه داراي چند متغيرپيوسته اند بنام «تجزيه واريانس» ميباشد.عبارت تجزيه واريانس را معمولا با علامت اختصاري “ANOVA” نشان ميدهند. همان طوريكه از اسم مذكور برمي آيد تجزيه واريانس روشي است كه واريانس نمونه را به عوامل مفيدي تجزيه مي نمايد. تجزيه واريانس جهت حل مسائل متنوع عنوان ميشود مثلا يكي از

كاربردهاي آن در طبقه بندي يك متغيره وكاربرد ديگر آن در طبقه بندي دو متغيره است.

روشهاي غير پارامتري

در آزمون هايي چون مقدار µ شرط نرمال بودن توزيع جامعه و يا در آزمون πشرط دو جمله اي بودن توزيع جامعه از مفروضات الزامي بوده است. درحاليكه در توزيع X 2 براي مقايسه فراواني مشاهدات با فراواني كه انتظار مي رود به هيچگونه مفروضاتي نياز نيست. در روشهاي غيرپارامتري هر گونه اطلاعي از نوع توزيع جامعه، غالبا فراواني مورد انتظار محاسبه ميگردد. بطور مثال در بررسي مستقل بودن دو متغيردرمسأله جدول توافقي اطلاع از نوع توزيع دو متغيير ضرورتي ندارد.
بطورخلاصه در شرايطي كه هيچگونه اطلاعي از توزيع متغير در اختيار نيست و يا احتياجي به

دانستن نوع متغير نمي باشد، از روشهاي غيرپارامتري استفاده ميشود. زيرا در روشهاي غيرپارامتري مقدار پارامتر از جامعه اي كه توزيع آن مشخص نگرديده مورد آزمون قرار ميگيرد. در حاليكه در سايرروشها نوع توزيع جامعه معلوم است و بديهي است كه اگر نوع توزيع پارامتر جامعه مشخص باشد بهتر است از روشهاي استاندارد آماري استفاده گردد. چون در چنين شرايطي اگر بتوان روشهاي غيرپارامتري را بكار گرفت بدون شك نتيجه حاصله به خوبي نتيجه حاصله از روشهاي استاندارد را نخواهد داشت. بنابراين تنها در شرايطي از روشهاي غيرپارامتري بايستي استفاده نمود كه بكار بردن روشهاي استاندارد مجاز نباشد. روشهاي غيرپارامتري قادرند علاوه بر مسائل

حل شده توسط روشهايي چون آزمون مقدارµ و يا آزمون π، مسائل جديد ديگر را نيز حل كنند.

آمار پارامتري و ناپارامتري

آنهايي كه با آماره آشنا هستند مي دانند كه معمولا با معلوم بودن نوع توزيع احتمال يك متغيير تصادفي، دربارة يك يا چند پارامتر مجهول بر اساس يك نمونه تصادفي استنباط آماري انجام ميگيرد مثلا فرض مي كنيم كه وزن يك نوزاد متغير تصادفي نرمال باشد و بخواهيم ميانه اين متغير را يعني پارامتري كه وزن ۵۰ درصد از نوزادان كه از هستند بر آورد كنيم چون در توزيع نرمال ميانه برابرند در نتيجه مدل نمونه ، هم برآورد ميانگين و هم برآورد ميانه ميباشد اينجا برآورديابي با دانستن نوع توزيع اجرا ميشود از اينرو اين شاخه از آمار را«آمار وابسته به توزيع» يا در اصطلاح «آمار پارامتري» ميگويند. حال فرض كنيد كه توزيع احتمال وزن نوزاد مجهول باشد بخواهيم ميانه را برآورد كنيم نخست نمونه عددي داده شده را به صورت يك رشته غير نزولي از كوچك به بزرگ، مرتب ميكنيم در صورتي كه اندازه نمونه فرد باشد عدد ميان اين رشته و در صورتي كه اندازه نمونه زوج باشد نصف مجموع دو عدد ميان اين رشته را به عنوان برآورد ميانه بر مي گزينيم در اينجا برآورديابي ضمن مجهول بودن نوع توزيع احتمال وزن كودك انجام ميگيرد از اين رو اين شاخه از آمار را«آمار توزيع آزاد » يا در اصطلاح آمار «آمار ناپارامتري» مي نامند.

تاريخچه آمار ناپارامتري

تاريخ آمار ناپارامتري هم مانند آمار پارامتري به اوايل قرن ۱۸ ميلادي برمي گردد ، در ۱۷۱۰ ميلادي مقاله اي منتشر شد و طي آن بر اساس آمار نوزادان شهر لندن در فاصله سالهاي ۱۶۲۹ تا ۱۷۱۰ ميلادي ادعا گرديد كه مشيت الهي بر اين است كه تعداد نوزادان پسر بيش از تعداد نوزادان دختر باشد در حقيقت اين ادعا موضوع آزمون ناپارامتري معروف مي باشد كه امروز به نام «آزمون نشانه»

شهرت دارد با اين حال آمار ناپارامتري بيش از دو قرن ناشناخته بود تا اينكه پيشرفت آن با انتشار دو مقاله پژوهشي، يكي توسط شيميداني به نام ويلكاكسون در ۱۹۴۵ و ديگري توسط دو آماردان به نامهاي من و ويتني در ۱۹۴۷ آغاز گرديد. قبل از انتشار اين دو مقاله اصطلاح « ناپارامتري» براي اولين بار در رساله دكتراي يك آماردان به نام ولفوتيز در ۱۹۴۲ بكار رفته است در حال حاضر آمار ناپارامتري به عنوان يك مسأله روشهاي آماري براي دستيابي به حقايق علمي دررشته هاي مختلف علوم گسترش پيدا كرده است و تا امروز دهها كتاب و صدها مقاله در اين باره انتشار يافته است.
كساني كه آمار مقدماتي و روشهاي محاسباتي آمار را بدون دانستن تئوري آمار بكار مي برند اغلب با پرسشهاي بيشماري روبرو مي شوند مثلا مي پرسند: «چرا درفرمول واريانس يك نمونه n تايي گاهي n وگاهي n-1 ديده ميشود ؟»،«چرا مدل يك نمونه تصادفي از توزيع نرمال بهتري برابر براي پارامتر ميانگين است ؟»،« چرا فلان فرضيه آماري را يك آماردان رد مي كند و آماردان ديگر رد نمي كند؟»

آمار رياضي يا تئوري آمار به اينگونه پرسشها پاسخ مي دهد اين تئوري را ، با وجود ريشه هاي تاريخي ، در حقيقت فيشر و نيمان دو آماردان برجسته در سالهاي ۱۹۳۰ بنا كردند وسپس ديگران دنبال كار آنها را گرفتند در عصر ما دهها كتاب و صدها مقاله ارزنده در زمينه آمار رياضي و كاربرد آن در علوم و مهندسي ، علوم پزشكي و علوم اجتماعي و تربيتي ، اقتصاد و مديريت يافت مي شوند. با اين حال پژوهش درباره آمار رياضي و نوآوريهاي سودمند براي روشهاي آماري همچنان ادامه دارد .در آمار توصيفي داده ها ، يعني اطلاعات عددي درباره امري ،را طبق قواعدي خلاصه مي كنيم

وسپس جدولهاي فراواني،گرافهاي آماري، ارائه مي دهيم در درس احتمال با اصول شانس و قوانين متغيرهاي تصادفي آشنايي پيدا مي كنيم در آماررياضي با استفاده از اسلوب رياضي و روشهاي معقول ، آمار توصيفي و احتمال را با هم ارتباط مي دهيم وبه يك نوع نتيجه گيري به نام «نتيجه گيري آماري» مي پردازيم .
مفهوم آمار و احتمال يا «انديشه آماري» عبارتست از جمع آوري داده هاي عددي دربارة امري و تجزيه و تحليل آنها براساس مدلهاي آماري ونتيجه گيري آماري، براي ارائه نظريه اي تازه دربارة آن امر.

مفهوم آمار

مفهومي كه مردم عادي از آمار دارند شامل گرد آوري مقداري اطلاعات و نمايش آنها بصورت جدول و نمودار است ودر يك مفهوم وسيعتر ارائه پاره اي مشخصات عددي چون ميانگين درصدها و غيره است ولي مي توان تعريف جامعتر آمار را بصورت زير بيان نمود. آمار علمي است كه مشخصات جامعه ها را از نظر كمي ولي با در نظر گرفتن كيفيت مشخص كننده هاي آن جامعه مورد بررسي قرار مي دهد در واقع آمار داده هاي عددي را جمع آوري ، نماش وتحليل مي كند .

در مرحله تحليل آماري با مسئله متفاوت درباره فرضيه هاي مختلف مواجه ميشويم. كه قسمت اصلي تئوري استنتاج آماري را تشكيل مي دهد قضاوتهاي آماري با قضاوتهايي كه در آن رشته هاي مختلف علوم رياضي بكار ميرود تفاوت اساسي دارد براي روشن شدن مطلب اين تفاوت را با ذكريك مثال روشن ميسازيم اگر بررسي تأثير انسولين در پايين آوردن قندخون موردنظر باشدروش استاندارد شامل انجام آزمايش روي افراد مختلف، جمع آوري اطلاعات و آنگاه اخذ تصميم بر پايه اين مشاهدات است.

مثلا اگر ۵۰ فرد را مورد مطالعه قرار دهيم و انسولين موجب پايين آوردن قند خون در كليه افراد شود عقل سليم حكم مي كند كه فرضيه بي تأثير بودن انسولين در قندخون را مردود بدانيم اگر اولين آزمايش، انسولين قندخون ۴۹ نفر و يا حتي ۴۸ نفر را پايين آورد باز هم عقل سليم اجازه نخواهد داد كه به دليل مشاهده يك يا دو مورد منفي فرضيه بي تأثير بودن انسولين را بپذيريم چرا كه ممكن است مشاهده موارد منفي نتيجه تأثير عوامل بيشماري باشد كه از طرف محقق قابل كنترل نمي باشد ذكر اين نكته ضروري است كه اگر در مثال فوق نسبت افرادي كه با تزريق انسولين ، قندخون آنها پايين مي آيد به اندازه اي نباشد كه بتوان فرضيه بي تأثير بودن انسولين را رد كرد و دليل براي

 

اثبات بي تأثير بودن انسولين نيز نخواهد بود. چنانچه ملاحظه گرديد قضاوت آماري صرفا براساس مشاهدات استوار است در حاليكه در علوم رياضي هرگز چنين قضاوتهايي مورد استفاده قرار نمي گيرد و همين كه موردي مشاهده شود كه با فرضيه مورد بحث مغايرت داشته باشد درست نبودن فرضيه به اثبات مي رسد.
هدف آن زمينه از علم كه به عنوان آمار معروف است ارائه طرقي براي اندازه گيري مقدار اين ذهنيت است كه در نتيجه گيريهاي دانشمندان دخالت دارد ، و بنابراين علم را از عقيده جدا ميكند. اين كار با در نظر گرفتن يك مدل نظري براي آزمايش به مرحلة اجرا در مي آيد، نظير مدلي كه «پرتاب يك سكه» ناميده ميشود و براي آزمايش اول مورد بحث قرارگرفت. قوانين احتمال براي اين مدلها بكار ميروند تا براي برآمدهاي ممكن مختلف آزمايش تحت پذيره هايي كه برآمد آزمايش را تنها شانس و نه موسيقي يا تزريق دارد، تعيين ميكند.«شانسها» (احتمال ها) را مشخص كنند. بعد آزمايشگر در باره اينكه آيا نتايج ،نتايج تيمارهايي هستند كه به كار رفتند، يا همان نتايج مي توانسته اند به

آساني با شانس تنها بدون هيچ تيماري،رخ دهند،يك مبناي عيني براي تصميم گيري پيدا ميكند. اگر چه گاهي توصيف يك مدل مناسب نظري براي آزمايش مشكل است. مشكل واقعي اغلب بعد از اينكه مدل تعريف شد ،به صورت پيدا كردن احتمال هاي متناظر با مدل پديد ميايد. مدلهاي معقول زيادي ابداع شده اند كه براي آنها تا كنون هيچ جواب احتمالاتي پيدا نشده است. بنابر اين آمار شناسان غالبا مدل را اندكي تغيير مي دهند تا بتوانند احتمال مورد نظر را محاسبه كنند، با اين

اميد كه تغيير در مدل آنقدر جزئي است كه ميتوان مدل تغيير يافته را هنوز نسبتا واقعي فرض كرد. در اين صورت ميتوانند جواب هاي دقيق اين مسائل تقريبي را بدست آورند. اين قسمت از آمار را گاهي آمار پارامتري مي نامند كه آزمونهاي مشهوري مانند آزمون T و آزمون F و غيره را شامل ميشود.
در اواخر دهه ۱۹۳۰ رهيافتي ديگر براي مسأله پيدا كردن احتمال ها قوت پيدا كرد. اين رهيافت در صورت نياز، متضمن ايجاد تغييراتي در مدل واستفاده از شيوه هاي ساده و غير پيچيده اي براي پيدا كردن احتمال هاي مطلوب است يا حداقل تقريب خوبي براي اين احتمالهاست. بنابراين راه حلهاي تقريبي مسائل دقيق به دست آمد كه نقطه مقابل راه حلهاي دقيق براي مسائل تقريبي است كه با آمار پارامتري بدست مي آيند. اين برنامه جديد شيوه هاي آماري به آمارناپارامتري مشهور شد.

علاوه بر مزيت دارا بودن مدل ساده تر، روش هاي آمار ناپارامتري اغلب شامل كارهاي محاسباتي كمتري هستند و بنابراين كاربرد آنها ساده تر و سريعتر از ساير روشهاي آماري است. مزيت سوم تكنيك هاي آمار ناپارامتري اين است كه اغلب نظريه هاي روش هاي آماري ناپارامتري را بدون اينكه نيازي به كاربرد رياضيات بالاتر از حد جبر دبيرستاني باشد، ميتوان تهيه كرد. دانشمندي كه نظريه مربوط به روشهاي آماري را درك ميكند كنمتر احتمال دارد كه آن روشها را در وضعيتي كه چنين كاربردي نادرست است به كار برد و اگر روش او مدلي باشد كه بوسيله ساير آمار شناسان

بررسي نشده است بهتر ميتواند روشهاي آماري خود را بوجود آورد. بخشهايي از آمار ناپارامتري كه به استفاده از رياضيات پيشرفته تري نياز دارند، بدون اثبات معرفي خواهد شد. اما هر موقع كه مناسب باشد،مرجعي براي آن معرفي خواهد شد كه اثبات را ميتوان در آن پيدا كرد.
موضوع آزمون هاي آماري مدتهاست كه از نظر فلسفي ، رياضي و علمي مطرح ميباشد و امروز به عنوان يكي از روشهاي علمي تقريبا در همه رشته ها به كار مي رود.
علوم تجربي و اجتماعي تا حدودي با عامل شانس و عدم يقين همراه مي باشد. معمولا بايد نتيجه پژوهش را در اين علوم با ضريب احتمال بيان كرد. اين سبب ميشود كه علم آمار با اين علوم در عمل و گاهي از نظر فلسفي پيوند يابد.
براي دست يافتن به يك قانون علمي مرحله اساسي مشاهده و بيان نتيجه آن بوسيله عدد ميباشد، با تكرار اين مشاهده اعدادي به نام داده ها به دست مي آيند كه به كمك آنها و استفاده از روشهاي آماري ممكن است فرضيه اي را با احتمال لازم تأييد كرد يا مردود شناخت. بنابراين علم آمار مددكار توانا براي روشهاي علمي و جهان بيني ميباشد. درحقيقت بسياري از فرض ها در علوم و درزندگي روزانه فرضهاي آماري هستند كه ممكن است پژوهشهاي آينده و مشاهدات تازه آنها را مورد ترديد قرار دهند.
انسان هميشه اين فرضها را مي آزمايد تا قوانيني را كه بر جهان و بر زندگي اجتماعي حكمفرماست با دقت و احتمال لازم پيدا كند. اين روند هرگز پايان نمي يابد و هيچ فرضي كه دستخوش احتمال مي باشد هميشه پايدار نمي ماند. به عنوان مثال، قانون جاذبه نيوتون بيش از دويست سال بر مكانيك و فيزيك تسلط داشت و براي بيان حركت اجسام مورد استفاده قرار مي گرفت. ولي نظريه انيشتين ظريفانه به تصحيح نتايج نيوتون مي پردازد و جانشين قانون جاذبه نيوتوني مي شود با اين حال،به گفته انيشتين در زمينه علم بدست آوردن موفقيتها كه همواره معتبر ميباشد بسيار دشوار است. بنابر اين در زمينه علوم پزشكي و اجتماعي اين دشواري به مرانب بيشتر خواهد بود، از اين رو برداشت آماري از طريق آزمو هاي آماري مبحثي مهم و بحث انگيز است. بي جهت نيست كه تا امروز چندين كتاب و دهها مقاله در اين باره نگاشته شده است.

هر شاخه از علوم بر اساس موضوع مربوطه هنر يادگيري خاص خود را دارد و علم احتمال نيز از اين قاعده مستثني نيست هنر يادگيري علم احتمال مبتني بر درك مفاهيم و حل مسائل زياد ومتنوع است نظريه احتمال در حقيقت همان عقل سليم است كه تا مرتبه محاسبه تنزل پيدا كرده است اين نظريه ما را قادرمي سازد كه با دقت هر آنچه را كه اذهان منطقي با كمك غريزه ادراك ميكنند دريابيم با اين تفاوت كه غالبا نمي توانيم چگونگي آنها را توضيح دهيم .

امروزه نظريه احتمال ابزار اساسي و مهم تحقيق براي همه دانشمندان ، مهندسين ،پزشكان ، قضات و صنعتگران به حساب مي آيد در حقيقت امروزه روشنفكران آموخته اند كه سؤال نكنند «آيا چنين است؟» بلكه سؤال كنند «احتمال اينكه چنين باشد چقدر است؟» آنهايي كه با آمار آشنا هستند مي دانند كه معمولا با معلوم بودن نوع توزيع احتمال يك متغيير تصادفي دربارة يك يا چند

پارامتر مجهول بر اساس يك نمونه تصادفي استنباط آماري انجام ميگيرد مثلا فرض كنيم وزن يك نوزاد متغير تصادفي نرمال باشد و بخواهيم ميانه اين متغير را برآورد كنيم چون در توزيع نرمال ميانگين و ميانه برابرند در نتيجه معدل نمونه هم برآورد ميانگين و هم برآورد ميانه مي باشد در اينجا برآورديابي با دانستن نوع توزيع اجرا مي شود از اين رو اين شاخه از آمار را وابسته به توزيع يا در اصطلاح آمار «آمار پارامتري » مي گويند حال فرض كنيد كه توزيع احتمال وزن نوزاد مجهول باشد و بخواهيد ميانه را برآورد كنيد نخست نمونه عددي داده شده را بصورت يك رشته غير نزولي از كوچك به بزرگ مرتب مي كنيم در صورتيكه اندازه نمونه فرد باشد عدد ميان اين رشته و درصورتيكه اندازه نمونه زوج باشد نصف مجموع دو عدد ميان اين رشته را به عنوان برآورد ميانه برميگزينيم در اينجا برآورديابي ضمن مجهول بودن نوع توزيع احتمال وزن كودك انجام مي گيرد از اينرو اين شاخه از آمار را «آمار توزيع آزاد» يا در اصطلاح آمار«آمارناپارامتري» مينامند. درآمار پارامتري يك خانواده توضيح داديم كه درمقدار پارامتر يكسان نيستند مثلا خانواده نرمال با پارامتر ميانه ولي در آمار ناپارامتري خانواده بخصوص در نظر نمي گيريم.
آمار علم مطالعه و اطلاعات (عددي) در قالب جداول و نمودارها و استنتاج از اطلاعات موجود براي تعميم دادن به كل جامعه مي باشد. براي رسيدن به اين ديدگاه نيازمند استفاده از علومي مانند رياضيات و كامپيوتر مي باشيم . رياضيات بعنوان پايه ومحور اصلي قضايا ونتايج بكار رفته در آمار بوده و بسياري از خواص آماري را با زباني بليغ و شيوا اثبات و تعبير مي كند، كامپيوتر نيز بعنوان ابزاري الكترونيكي در انجام محاسبات طاقت فرسا و تكراري مي باشد كه اگر قرار بود كارهاي ميانه آمار

ي را به نيروي انساني واگذاريم شايد روزها و ماهها به همراه منابع سرسام آور هزينه متحمل مي شديم. در حاليكه همين كارهاي ماهيانه آماري و محاسبات مربوط به آنها در قالب زماني شايد به اندازه چند ثانيه انجام مي شود درباره نقش اساسي رياضي در پيشبرد ساير علوم و فن آوري شواهد زيادي وجود دارد شاهد بارز آن سرمايه گذاريهاي مستدامي است كه كشورهاي صنعتي

روي پژوهشهاي رياضي وساير علوم مي كنند .
احتمال و آمار شاخه اي از رياضي است كه براي انجام مطالعات اجتماعي ، اقتصادي، پژوهشهاي عملياتي ، بهداشتي ، پزشكي ، حمل ونقل ، … بسيار رهگشاست در واقع مي توان گفت كه آمار رهگشاي پژوهشهاي عملي كاربردي است ولي بايد توجه داشت كه درك آمار وروشهاي كاربردي آن نياز به احتمال دارد در حقيقت احتمال پايه آمار است و آناليز رياضي پايه احتمال. بنابراين اگر بخواهيم روشهاي آماري را درك كنيم بايد پايه رياضي خوبي داشته باشيم .
رشته آمار با جمع آوري و تجزيه وتحليل داده ها سروكار دارد پيشرفتهاي فنآوري اطلاعات بويژه در ارتباط با تحولات علوم و بازرگاني نياز به وجود آماردانان محقق را جهت آزمون مقادير بسيار بزرگ داده هاي جمع آوري شده ، افزايش داده است. ميدانيم كه داده ها معادل با اطلاعات نيستند.

هنگامي كه داده ها،كه اميدواريم با كيفيت بالا باشد جمع آوري شدند نياز تقريبا نامحدودي به آماردانان است كه از اين داده ها سر در بياورند يعني داده ها بايد تجزيه و تحليل شوند و اطلاعاتي توليد كنند كه بر اساس آنها بتوان تصميم گيري كرد .
اگر به دوره هايي كه درآنها داده ها نقش اصلي را بازي مي كنند بيانديشيم به فهرستي تقريبا بي پايان بر مي خوريم : حسابداري، علوم آكچواري، علوم جوي، علوم زيستي، اقتصاد، سنجش آموزش ، علوم محيطي ، اپيدميولوژي ، امور مالي ، ژنتيك ، ساخت و ساز ، بازاريابي ، پزشكي ، صنايع

داروسازي ، روان شناسي ، جامعه شناسي ، ورزش و غيره . با توجه به اين زمينه هايي كه آمار در آنها مورد استفاده قرار مي گيرد بايد آن را بعنوان يك علم كاربردي در نظر گرفت به هر حال براي درك عميق اين علم كاربردي لازم است اهميت خلق الگوها را براي هر موقعيت تحت مطالعه، درك كنيم. امروزه هيچ الگويي دقيقا درست نيست ولي بعضي از آنها براي تقريب موقعيتهاي واقعي بسيار مفيد هستند . اغلب الگوهاي مناسب آماري نيازمند زمينه خاصي از رياضيات و احتمال هستند.
روشهاي آماري در واقع قلب روشهاي علمي هستند. مشاهدات را بدست آورده ، ادعاها را بيان ميكنيم با تجزيه و تحليل داده ها اطلاعات دربارة ادعاها را بايد اصلاح نمود داده هاي بيشتري جمع آوري كنيم تا ادعاي اصلاح شده را بيازمائيم در اين فرايند خود بازنگر ، به وضوح نقش اصلي آمار با تكيه بر طرح و تجزيه آزمايش ها و استنباطهايي كه تصميم ها بر پايه آنها اخذ خواهند شد ، بازي ميكند.
در آمار براي اتخاذ تصميم و انتخاب عمل ، اطلاعات ارائه مي شود بعنوان مثال براي بهبود كيفيت محصولات توليد شده ، ارائه خدمات بهتر، بازاريابي براي محصولات يا خدمات جديد ، پيش بيني به انرژي، طبقه بندي بهتر بيماريها و غيره اطلاعات ارائه مي شود.
آماردانان مي دانند كه در استنباط هايشان خطاي كوچكي وجود دارد و تلاششان براين است كه احتمال اين گونه خطاها رادر حد امكان كوچك نمايند . علت وجود چنين عدم اطميناني به جهت وجود تغييرات در داده هاست با اينكه آزمايشها تحت شرايط به ظاهر كاملا يكسان تكرار مي شوند ولي نتايج از آزمايشي با آزمايش ديگر بسيار فرق مي كند ما تلاش مي كنيم كه كيفيت داده ها را با هرچه اعتماد پذيرتر كردن آنها افزايش دهيم اما داده ها به سادگي در الگوهاي موردنظر ما قرار نمي گيرند .
تقريبا در تمام فرايند ها تغيير وجود دارد آماردان با عنايت به وجود چنين عدم اطميناني ، با بكار

گيري بهترين روش ممكن براي تعيين الگو تلاش مي كند ولي هميشه ساختار خطاي برآوردهاي آماري را توضيح مي دهد اين درس مهمي است كه بايد آموخت تغييرات تقريبا همه جا حضور دارد اين وظيفه آماردان است كه تغييرات را درك كند اغلب علاقه مند به كاهش تغييرات هستيم مثلا در توليد محصولات چنانچه تغييرات كم باشد محصولات سازگارترند به عبارت ديگر در توليد اتومبيل چنانچه تغييرات ساخت اتومبيل كاهش يابد وهر « در» به مقدار هدف نزديكتر ساخته شود ، در ماشين بهتر در جايش قرار خواهد گرفت .
بسياري از آماردانان بر نياز « انديشه آماري» در عمليات روزانه مهندسي صنايع تأكيد ميكنند. اين موضوع بر سه نكته استوار است كه دوتاي آنها را در بند قبلي مطرح كرديم :
۱٫ تغييرات در تمام فرايند ها وجود دارند.
۲٫ درك كاهش تغييرات كليد اصلي موفقيت است.
۳٫ تمام كارها در دستگاههايي كه از درون به هم مرتبط هستند به انجام ميرسند.
ادوارد دمينگ آمار دان قابل احترامي كه در باره بهبود كيفيت،كارهاي مهمي انجام داده است به اين سه نكته بخصوص سومين آن اشاره كرده است او به نحو زيركانه اي به اين نكته اشاره نموده كه نميتوانيم با ماكزيمم نمودن مؤلفه هاي فردي موجبات ماكزيمم شدن كل عمليات را پديد آوريد مگر آن كه آنها از هم مستقل باشند در صورتي كه در اغلب موارد اينها بسيار بهم وابسته اند افراد در بخش هاي توليدي مختلف بايد به همراه هم كار كنند تا بهترين توليدات يا خدمات را ارائه دهند اگر چنين نباشد ممكن است آنچه را كه يك واحد براي بهبود كار خود بكار ميگيرد موجب صدمه زدن به كار ديگران شود دمينگ اغلب به يك اركستر اشاره ميكند كه در آن نياز به همكاري تك تك اعضا براي خلق نتيجه دلنشين و سازگار وجود دارد هر دانشجوي آمار بايد طبيعت تغييرپذيري را درك كرده نياز به ايجاد الگوهاي احتمالي براي تغييرپذيري را احساس كند ما نمي توانيم با ترس از عدم اطمينان موجود از تصميم گيري و استنباط پرهيز كنيم در هر حال نتايج كار ما به طور وسيعي به الگو هاي احتمالي كه انتخاب كرده ايم بستگي دارند بعضي از افراد الگوسازهاي بهتري هستند تا

ديگران به همين دليل استنباط ها و تصميم گيريهاي بهتري انجام ميدهند فرض هاي لازم براي هر الگوي آماري به دقت بررسي خواهند شد و اميد ميرود كه خواننده به الگوساز بهتري تبديل شود در خاتمه بايد اذعان كنيم كه تحليل هاي آماري كاملا وابسته به رايانه اند در حوزه هاي تجزيه تحليل كاوشي داده ها و «داده كاوي» آماردانان و محققان علوم رايانه بايد واقعا با هم كار كنند امروزه توسعه نرم افزارهاي آماري براي تجزيه و تحليل داده هاي پيچيده امري اساسي است با عنايت به توسعه ارتباط بين اين دو حوزه نصيحت خوب براي دانشجويان با هوش اين است كه درسهاي

اساسي هر دو رشته آمار،علوم رايانه و يا رشته اي بين اين دو رشته را به اتمام ميرسانند در آينده چه در بازار كار و چه براي دوره هاي تحصيلات تكميلي بسيار گسترده خواهد بود واضح است كه آنها ميتوانند مدارك بالاتر را در آمار يا علوم رايانه يا هر دو اخذ كنند اما از همه مهمتر اين است كه آنها ميتوانند نامزد هاي خوبي براي كار در حوزه هاي تحصيلات تكميلي ديگر رشته ها مانند علوم آكچواري، مهندسي صنايع ،علوم مالي، بازار يابي،حسابداري، علوم مديريت،روانشناسي،اقتصاد ،

جامعه شناسي،پزشكي،علوم بهداشتي و نظاير آن باشند بسياري از اين حوزه ها به نحوي داراي «ساختار رياضي» شده اند كه برنامه هاي درسي شان مناسب حال دانشجويان رشته هاي آمار و علوم رايانه است اغلب اين دانشجويان در حوزه هايي غير از اين رشته خودشان به «ستارگان» تبديل ميشوند ما به واقع اميدواريم كه دانشجويان را به اندازه كافي علاقمند كنيم كه در پي مطالعه هر چه بيشتر آمار باشند اگر چنين كنند موقعيت هاي شغلي كاملا موفق براي آنها تقريبا بي پايان خواهد بود.