Font Size

SCREEN

Profile

Layout

Direction

Menu Style

Cpanel

معرفی

خرید پرسشنامه، دانلود پرسشنامه، تدوین مقاله روانشناسی، پایان نامه روانشناسی ، پرسشنامه رایگان روانشناسی، تحلیل آماری، تدوین کتاب با قیمتی ارزان

خدمات آمارکده

پایان نامه ، مقاله ، تحلیل آماری ، ساخت و فروش پرسشنامه ، نشر کتاب ، ترجمه ، صفحه آرایی و ویرایش پایان نامه و ...

راه های تماس با آمار کده

تلفن تماس: 09364126317

ایمیل

این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید

آموزش آمار توصیفی

آموزش آمار به زبانی ساده برای آموزش پایان نامه نویسی به بخش آموزش پایان نامه نویسی بروید

آمار چیست؟

معادل كلمة آمار در زبان انگليسيSTATISTICSاست كه ریشه آن از كلمة لاتينSTATUSمشتق شده و یکی از معانی اصلی آن در فارسی دولت یا ایالت است.جالب است که اولین معنی کلمه STATIST در دیکشنری ها سیاستمدار و سپس آمار دان می باشد.به نظر می رسد دلیل این نامگذاری آن است که این علم در ابتدا در اختیار پادشاهان و حکومت ها بوده است.

 

از نظر تاریخی می توان گفت از لحظه ای که شمارش اختراع شد علم آمار نیزگسترش پیداکرد واهمیت آن به دلیل علاقه بشر به پیش بینی و مدل سازی حوادث طبیعی کمتر از خواندن و نوشتن نبوده است.

منشأ ظهور آمار به صورت توصیف اطلاعات را می توان سرشماری هایی که حدود 4000 سال قبل از میلادمسیح توسط بابلی ها و مصری ها و بعداً توسط امپراتوری های روم و ایران درباره اطلاعات مربوط به زاد و ولد و دارائی های افراد جامعه زیر سلطه خود انجام می گرفته، به حساب آورد. در آن زمان بود که روش هایی برای جمع آوری، تنظیم و تلخیص داده ها ابداع گردید.

واژه آمار ریشه در تاریخ زبان و فرهنگ کهن ایرانی دارد و قدمت آن به زمان هخامنشبان می رسد و تا اواسط دوره اشکانیان واژه هامار یا آمار به معنی شمار و واژه شاهامار به معنی سرشماری به کار می رفته است.

به گواه سنگ نوشته ها و آثار مورخان شرق شناس، در زمان کوروش آمارگیری در مقیاس وسیع و در تمام پهنه ممالک تابعه حکومت مرکزی ایران انجام می شده و اخذ هرگونه تصمیم درباره ولایات بایستی مبتنی بر شناسائی های محلی و اطلاع دقیق بر کثرت و یا قلّت جمعیت و قدرت و توانایی های مالی آن ولایات باشد. در زمان داریوش کبیر، به منظور جمع آوری آمار، تشکیلات منظمی وجود داشته است و با استفاده از اطلاعات جمع آوری شده، دفاتر مالیاتی و نظامی تدوین می یافته و بودجه مملکتی بر اساس آن تنظیم می شده است. ساسانیان توجه بیشتری به آمار داشتند و امور مالی، کشاورزی و صنعتی و بازرگانی خود را بر اساس آمارها و اطلاعاتی که مأموران سرشماری جمع آوری می کردند، به انجام می رساندند. به گونه ای که در زمان خسرو انوشیروان، برای اخذ مالیات سرانه، ضمن انجام سرشماری نفوس، سن افراد و میزان ثروت آنها تعیین می شد و حتی میزان محصول درختانی مثل نخل، زیتون و تاک تعیین می گردید و بر اساس آن برای افرادی که سن آنها بین 20 تا 50 سال بود، مطابق ثروت و مکنتی که داشتند، مالیات تعیین و آگهی می گردید.

در گذشته، آمار فقط با بيان اطلاعات و مقادير عددي دربارة اقتصاد، جمعيت شناسي و اوضاع سياسي حاكم در يك كشور، سر و كار داشته است.حتي امروز، ‌بسياري از نشريات و گزارشهاي دولتي كه تودهاي از آمار و ارقام را در بردارند و تحت عناويني از قبيل « آمار توليد مزارع» و «آمار كارگران» منتشر ميشوند، معني اولية كلمة آمار را در ذهن به عنوان عدد و رقم زنده ميكنند. اكثر افراد معمولي هنوز اين تصور غلط را دربارة آمار دارند كه آن را منحصر به ستونهاي عددي سرگيجهآور و گاهي يك سري شكلهاي مبهوتكننده مي‌دانند.

در قرن چهاردهم برای محاسبه نرخ بیمه، جمع آوری اطلاعات درباره تولد و وفات، تصادفات و حوادث رایج گردید.

در اواسط قرن شانزدهم اولین کتاب احتمال توسط کاردن با عنوان "بازی ها و شانس" نوشته شد، او در این کتاب روش های تقلب در بازی های قمار را ارائه داد. بعلاوه، موضوع پیش بینی در نتایج حاصل از انجام آزمایش ها را مطرح نمود. یکی از کارهای او پیش بینی روز وفات خودش بود که برای اثبات صحت پیش بینی در آن روز خودکشی نمود.
در اواسط قرن هفدهم پاسکال و فرما اولین کسانی بودند که مطالعه احتمال را به طور علمی شروع نمودند. در همین سال ها به طور همزمان مطالعات آماری به صورت توصیفی انجام می گرفت. مثلاً گرونت با مطالعه تعداد متولدین کشف نمود که تعداد پسرها از دخترها کمی بیشتر است، اما سال های اول زندگی تعداد بیشتری از پسرها فوت می کنند. استفاده از احتمال در آمار، در اواخر قرن هفدهم شروع شد، که در این باره می توان به مطالعات مندل در مورد قانون وراثت، گالتون در بکارگیری همبستگی و ارتباط بین صفات، و به ویژه فیشر در ابداع روش های مختلف استنباط آماری اشاره نمود.

از شروع قرن بیستم همه ساله روش های متعددی برای جمع آوری داده ها و تجزیه و تحلیل آنها به وجود آمده است.امروز آمار به عنوان يك چالش علمي، شامل مفاهيم و روشهائي است كه برای جمعآوري دادهها به وسيلة يك فرآينداز قبل طراحی شده وسر انجام نتيجهگيري به وسيلة تجزيه و تحليل اين دادهها در جهت پیش بینی و مدل سازی حوادث طبیعی به شمار می رود. بنابراين، يادآوري اين نكته ضروري است كه نظريه و روشهاي جديد آماري، از حد ساختن جدولهاي اعداد و نمودارها بسيار فراتر رفتهاند. نمايشهاي عددي به صورت جنبهاي فرعي از آمار درآمدهاند.

در یک جمله تعریف علم هنر تجزيه و تحليل دادهها باشد.

این علم دارای سه هدف اساسی می باشد:1 -جمع آوری و خلاصه کردن داده ها 2- آماده کردن داده ها برای تجزیه و تحلیل3- تعمیم دهی نتایج از نمونه برای جامعه(تعمیم از جز به کل)

برای تحقق دوهدف اول آمار توصیفی و هدف سوم آمار استنباطی به وجود آمد و از انجایی که در حرکت از جز به کل همیشه خطا وجود دارد نام آمار همیشه با احتمال برای اندازه گیری این خطا پیوند می خورد.شایددر ذهن بتوان احتمال را پلی بین آمار توصیفی تا آمار استنباطی تصور کرد.هر اندازه این پل با کمک ریاضیات محکمتر شود حرکت مطمئن تر خواهد بود.

چرا باید علم آمار را یاد بگیریم؟

-توانایی فکر کردن منتقدانه درمورد استدلالها با به کار بردن آمار به عنوان سند یا مدرک

-قابلیت خواندن و تفسیر دادهها، قابلیت فهم آنچه که خوانده میشود.

-توانایی فهم و تفسیر آمارهایی که هر فرد در زندگی روزمره با آنها سروکار دارد.

-توانایی استفاده صحیح از آمار توسط همه افراد جامعه

در یک جمله آمار یاد می گیریم تا سواد آماری داشته باشیم.سواد آماری، بر اظهار نظر با استفاده از آمار به عنوان سند و مدرک متمرکز شده است، همانگونه که سوادخواندن و نوشتن بر استفاده از کلمات به عنوان مدرک متمرکز شده است.پسسواد آماری یک توانایی وقابلیت وهنر است.

سواد آماری بیشتر درمورد سؤالات است تا جوابها. سوادآماری جوابهای زیادی ندارد. اما میتواند کمک کند تا سؤالات بهتری پرسش شود و در نتیجه ابزاری باشد تا تصمیمها و قضاوتهای بهتری صورت گیرد.پس سواد آماری یک ابزار است، ابزاری برای تصمیمگرفتن و قضاوت کردن حتی در شرایط نامعلوم.

و در پایان سواد آماری یک ضرورت است که اجازه نمی دهد در زندگی کلاهتان را باد ببرد.

با سواد آماریکسی است که :

- تفاوت بين رابطه همبستگی و رابطه علی را بداند.

- بین نسبت دادنیرا و نسبت داده شده فرق بگذارد.

- آماری که بر اساس نمونه به دست آمده را از پارامتر جمعيت تشخيص دهد.

- درصدها، ميزان ها و نرخ ها وشاخص ها و کاربرد آنها را بشناسدواز هر شاخص در موقع مناسب استفاده کند.

- فرق بین آمار و علم آمار را بداند

- فرق بین یک مدل ریاضی و یک مدل آماری را بشناسد.

تعاریف مهم در علم آمار:

تعریف جامعه: به مجموعه ای از افراد یا اشیا که بر اساس یک یا چند ویژگی(متغیر) خاص گرد هم می آیند. جامعه می تواند محدود یا نامحدود باشد.دانشجویانی که در سال 1392 در کشور فارغ التحصیل شده اند یک جامعه محدود است.اما دانشجویان فارغ التحصیل کشور یک جامعه نا محدود است.

تعریف نمونه:به بخش کوچکی از جامعه که نماینده آن جامعه باشد و بر اساس روشهای احتمالی و یا دست ساز انتخاب شده باشد نمونه می گویند.

تعریف سرشماری: بررسی تمام واحد های(اعضا) جامعه را سر شماری گویند.

تعریف نمونه گیری:انتخاب وبررسی واحد های نمونه را نمونه گیری گویند.

مزیت نمونه گیری بر سر شماری هزینه و وقت کمتر می باشد و یا اساسا در مواردی امکان سر شماری نیست . مثلا جهت تعیین طول عمر لامپهای یک کارخانه نمی توان همه تولیدات را سوزاند!

حداقل در تئوری سرشماری دقیقتر از نمونه گیری است. و لی در عمل ممکن است چنین نباشد! در سرشماری افراد زیادی اطلاعات را جمع آوری می کنند و افراد زیادی نیز در داده آمایی (ورود داده ها به نرم افزار) دخالت دارند و خطای این افراد محتمل است.

تعریف متغیر(ویژگی):مفهومی که از یک واحد جامعه به واحد دیگر جامعه تغییر می کند متغیر نام دارد. مانند گروه خونی ،جنسیت، قد،سن ، وزن و.. دو نوع متغیر کمی(عددی) و کیفی(گروهی) وجود دارد متغیر کیفی جامعه را گروه گروه می کند مانند جنسیت که مردم را به دوگروه مردان و زنان تقسیم می کند و یا گروه خونی ویا درجه مهارت کارگران ولی متغیر کمی چنین نیست مانند وزن ،سن ،قیمت ارزو... البته باید گفت نوع نگرش پژوهشگر در تعیین نوع متغیر مهم است به عنوان مثال وزن با نگاه سبک وزن ،میان وزن و سنگین وزن می تواند یک متغیر کیفی باشد.

تعریف مقیاس:

شماره پیراهن یک بازیکن فوتبال3 می باشد.یک تیم فوتبال 3 گل زده است.رتبه یک تیم فوتبال در جدول رده بندی 3 می باشد.3 دقیقه به پایان بازی فوتبال مانده است.

آیا تمام اعداد بیان شده در بالا یکسان است؟به عنوان مثال می شود بازیکن شماره 3 را با یک بازیکن شماره 2 ویک بازیکن شماره 1 عوض کرد چون 3=2+1 می شود!

همانطور که از جملات بالا معلوم می شود روش اندازه گیری متغیر ها با هم متفاوت است.درواقع متر های مختلفی برای اندازه گیری انواع متغیر ها موجود است .به روشی که با کمک آن یک متغیر اندازه گیری می شود مقیاس گذاری و مقدار بدست آمده مقیاس نام دارد.در واقع اگر تابع y=f(x) را در نظر بگیرید.f مقیاس گذار است و yیک مقیاس است.

انواع مقیاس:

مقياس اسمی: اين مقياس شامل  يک يا جند گروه با طبقه است که با هم متفاوتند اما بين گروهها هيچگونهارجحيتی وجود ندارد. ممکن است برای هر گروه يا طبقه شماره ای در نظر گرفته شود که ارزش ندارد بلکهجنبه" کد" يا شناسائی دارند.به عنوان مثال : متغیر جنس : 1- مرد 2- زن      متغیر نوع معلولیت : 1- جسم 2- ذهنی 3- روانی 4- حسی

مقياس رتبه ای: اين مقياس نسبت به مقياس اسمی خصوصيت اضافه ای دارد که در بين گروهها از نظر متغير مورد نظر برتری وجود دارد اما اين برتری قابل سنجش و مقايسه با ساير گروهها نيست . گروهها هم يکسان نيستند. گروهها نسبت به هم روی پله های يک نردبان قرار گرفته اند. به عنوان مثال:متغیر تحصیلات : 1- بیسواد 2- خواندن و نوشتن 3- ابتدائی 4- راهنمایی 5- متوسطه و یامتغیر میزان ناتوانی : 1- جزئی 2- کم 3- متوسط 4- زیاد 5- شدید

م   مقياس فاصله ای: در اين مقياس نسبت فاصله ها ثابت در نظر گرفته شده است. صفر در اين مقياس قراردادی است و به معنای هیچ نمی باشد.

مثال: فرض کنید دمای چهار جسم به درجه سانتی گراد به ترتیبc1=20وc2=30وc3=45وc4=50 باشد می توان دید که  جالب است که اگر این چهار جسم را به درجه فارنهایت تبدیل کنیم داریم :

جالب است که باز هم  بنابر این مقیاس های سانتی گراد و فارنهایت برای اندازه گیری دما مقیاس فاصله ای هستند.

مقياس نسبی: در اين مقياس خصوصيت اضافی آن است که صفر دليلی برای فقدان خاصيت مورد اندازه گيری است و در نتيجه نسبت بين اعداد در اين مقياس همان نسبت مقدار خاصيت مورد اندازه گيری است.

نسبت 6 کیلوگرم به 3 کیلوگرم 2 می باشد که دقیقا برابر با نسبت 6000 گرم به 3000 گرم می باشد.در ضمن صفر کیلوگرم برابر صفر گرم به معنای هیچ است صفر واقعی است.مقیاس کلوین برای اندازه گیری دما نسبتی است .چون صفر کلوین صفر مطلق است.یادمان باشد که سرما یعنی عدم وجود گرما و منفی ترین دما یعنی جایی که مقدار گرما هیچ است.

تعریف داده: به یافته عددی یک متغیر داده می گویند داده می تواند گسسته و یا پیوسته باشد.

داده گسسته:تنها مقادیر معینی را خواهند داشت(شکافی بین مقادیر ممکن وجود دارد)تعداد فرزندان یک خانواده یا یک یا دو یا سه و ... اما یک و نیم فرزند بی معنی است.

داده پیوسته:هر مقداری در درون یک فاصله را می‌تواند اختیار کند.ماند اندازه قد یا وزن یا ...البته معمولا داده های پیوسته گرد می شوند در این حالت شکل آنها شبیه داده های گسسته می شود ولی ماهیت آنها پیوسته است و باید به این موضوع دقت کرد.وقتی شما می گویید 70 کیلوگرم هستید در واقع می توانید 9/69 کیلوگرم باشید اماآن را به واحد یک گرد کردید. یا حتی اکر می گویید9/69 کیلوگرم هستید می توانید87/69 کیلو باشید که در این صورت آنرا به 1/0 گرد کرده اید و یا حتی اکر می گویید87/69 کیلوگرم هستید می توانید874/69 کیلو باشید که در این صورت آنرا به 01/0 گرد کرده اید و این داستان ادامه دارد.

تعریف آمار توصیفی:به مجموعه ای از روشها که داده ها را به صورت اعداد خاص ،جداول و نمودارها خلاصه می کند آمار توصیفی گفته می شود.

انواع فراوانی در آمار:

فرض کنیدN شی داریم که f1 تای آن از نوع x1 و f2 تای آن از نوع x2 و f3 تای آن از نوع x3 و... fk تای آن از نوع xk باشند به نوعی که داشته باشیم f1+f2+f3+…+fk=N در این صورت :

الف)fi فراوانی مطلق می باشد.

ب) بهFi که در آن می باشد فراوانی تجمعی گفته می شود در واقع فراوانی های مطلق در گروههای قبلی با هم جمع می شوند .روشن است که :                 F1=f1 ,F2=f1+f2 ,F3=f1+f2+f3,…

ج) به ri که در آن می باشد فراوانی نسبی گفته می شود روشن است که این فراوانی درصد یک گروه را در کل داده ها نشان می دهد.همچنین روشن است که

د) به Si که در آن یا فراوانی تجمعی نسبی گفته می شود

1- جدول فراوانی

Si

ri

Fi

fi

 
   

2

2

8

   

3

1

10

   

9

6

12

   

14

5

13

   

20

6

17

   

28

8

19

   

30

2

20

-

1  

-

N=30

مجموع

از این جدول برای تنظیم داده ها بر اساس انواع فراوانی ها استفاده می شود .نحوه تهیه آن برای داده های گسسته و پیوسته متفاوت است.

برای داده های گسسته به فرم زیر عمل می شود:

مثال 1. برای نمراتآزمون تستی درس آمار یک کلاس 30 نفری داریم:

الف) چند نفر نمره 12 گرفته اند؟f3=6                                      

ب)چند درصد افراد نمره 12 گرفته اند؟              

ج)چند نفرتا نمره 12 گرفته اند؟F3=9                                      

د) چند درصد افراد تا نمره 12 گرفته اند؟          

ب) داده های پیوسته:

برای داده های پیوسته اصولا روش منحصر به فردی وجود ندارد هدف تقسیم داده ها در چند بازه می باشد.در اینجا ما از روش استروجس به عنوان استاندارد استفاده می کنیم:

واحدگردکردن دادها

تعدادطبقاتازفرمولK=1+3/32LOG(N) محاسبه وهمواره جواب رو به بالاباواحد یک گردمی شود.

2

2) S=                                        

3) S + بیشترین داده max= XS     -کمترین داده Xmin=

4) دامنه تغییرات را محاسبه کنید          R=Xmax-Xmin  

5)فاصله طبقاتی را بدست می آوریم و آن را رو به بالا با واحد گرد کردن داده ها گرد می کنیم.

6) از Xmin شروع کرده و تا تا جلو می رویم.

مثال:داده های زیر مربوط به40 آزمایش مقاومت بتن می باشد .یک جدول فراوانی برای داده ها ترسیم کنید

16.36و19.85و18.9و18.56و12.85و12.93و18.73و26.54و19.25و18.73و18.64و15.36و25.71و16.51و18.21و12.86و14.0و24.05و22.94و22.34و20.06و16.48و26.07و18.93و19.94و25.45و19.14و18.73و22.78و16.08و19.99و24.23و14.46و18.88و16.88و18.47و15.44و24.59و25.42و15.11

1) 5/31 6                           = K=1+3/32LOG(40)

2)بیشترین رقم اعشاری 2 است پس واحد گرد کردن داده ها 01.0 می باشد و s=0.005 است.

3)             545.26= 005.0 + 54.26 max= X                  845.12 =005 .0- 85 .12 Xmin=

4)   R=26.545-12.845=13.7                                 5)

به کوچکترین عدد هر طبقه کران پایین و بزرگترین عدد را کران بالا می گویند.کران پایین طبقه اول 12.845 و کران بالای طبقه اول 15.135 است.

به mi نشان(مرکز) طبقه ( دسته) گویند.و برای هر طبقه عبارت است از مجموع کران پایین و کران بالا تقسیم بر 2

Si

ri

Fi

fi

mi  

حدود طبقات(دسته)

6/40

6/40

6

6

13.99

12.845 - 15.135

13/40

7/40

13

7

16.28

15.135 - 17.425

25/40

12/40

25

12

18.57

17.425 - 19.715

29/40

4/40

29

4

20.86

19.715 - 22.005

34/40

5/40

34

5

23.15

22.005 - 24.295

40/40

6/40

40

6

25.44

24.295 - 26.585

 

1  

 

40

 

         مجموع

معمولاً براي توصيف بهتر داده‌هاي آماري از نمودارها استفاده‌ مي‌کنیم. عموما اين نمودارها در ارتباط با داده‌‌هاي پيوسته به كار گرفته مي شوند.

نمودار برای داده های گسسته:1- نمودار دايره اي2- نمودار میله ای

براي رسم نمودار ستوني(میله ای) كافي است مقادير متغير را روي محور افقي تعيين كنيد سپس مستطيل هايي با فاصله و به ارتفاع فراواني مطلق براي هر مقدار متغير رسم كنيد

مثال   براي داده هاي زير نمودار ستوني رسم كنيد.

3   4   4 2   2   1 0 2 5 1 1 2 3   2 1 0 2 2 1 3

fi

 
x

2

0

5

1

7

2

3

3

2

4

1

5

مثالگروه خون 100 بيمار بستري در يك بيمارستان را در اختيار داريم نمودار دايره اي داده ها را رسم كنيد.

کافی است فراوانی نسبی در هر طبقه را در 360 درجه ضرب کنیم تا مساحت         قطا عی از دایره به دست آید که نماینده آن طبقه است.

قطاع دايره (درجه)

فراواني نسبي ri

فراواني fi

گروه خون

162

0/45

45

O

36

0/1

10

A

54

0/15

15

B

90

0/25

25

AB

نمودار برای داده های پیوسته:1- نمودار مستطيلي يا هيستوگرام 2- نمودار چند ضلغي فراواني3 منحنی فراوانی

1-براي رسم هيستوگرام فراواني يا نمودار مستطيلي داده ها ابتدا حدود طبقات را روي محور افقي تعيين مي‌كنيم. بعد مستطيل هائي كه عرض آنها به اندازه فاصله طبقات و ارتفاع آنها به اندازه فراواني مطلق طبقه مربوطه باشد، رسم مي‌كنيم.

براي رسم چند ضلعي فراواني داده ها نماينده طبقات را روي محور افقي تعيين مي‌كنيم. بعد نقاطي كه ارتفاع آنها به اندازه فراواني مطلق طبقه مربوطه باشد، مشخص كرده و آنها را به يكديگر متصل مي كنيم.

3- منحنی فراوانی:اگر تعداد مستطیل ها در هیستوگرام زیاد و عرض آنها کم شود آنکاه نمودار چند ضلعی فراوانی به منحنی فراوانی تبدیل می شود. معروفترین منحنی فراوانی منحنی نرمال است .که ان را در موقع مناسب معرفی خواهیم کرد.

اندازه هاي متمايل به مركز، يا اندازه هاي مركزي
يك اندازه مركزي، مركز ثقل يكهيستوگرامو يا يكمنحني توزيع را نشان مي دهد.

  • چهارک
  • دهک
  • صدک    
  • ·ميانه
  • ·نما
  • ·ميانگين رتبه دو-

میانگین حسابی:

اگر داده هاي جمع آوري شده در يك جدول توزيع فراواني در kطبقه تنظيم شده باشند، ميانگين از رابطه‌هاي

براي جدول فراواني رده‌بندي شده   :

براي جدول فراواني طبقه‌بندي شده:

كه در آن مقدار رده، فراواني و مركز طبقة ام جدول است.

مثال: جدول زیر توزیع بیماران مراجعه کننده به یک درمانگاه را بر حسب تعداد دندانهای فاسد آنها نشان می دهد.
میانگین حسابی این داده ها را محاسبه نمایید.

4

3

2

1

0

دندانهای فاسد

 

8

9

14

5

10

بیماران

 

مثال: جدول فراوانی سنی نوزادان در یک بیمارستان در جدول زیر تنظیم شده است. میانگین سن این نوزادان عبارت است از:

 
11-8

7-4

3-0

فاصله سنی بر حسب ماه

 

10

20

10

فراوانی

 

9.5

5.5

1.5

مرکز طبقه

 


مقدار ميانگين محاسبه شده با استفاده از جدول فراواني طبقه بندي با مقدار واقعي ميانگين تفاوت دارد، زيرا در محاسبه، مركز هر طبقه به جاي كل داده هاي آن طبقه در نظر گرفته شده است. اما این تفاوت قابل چشم پوشي است.

داده هاي پرت يا مقادير فرين و تأثير آنها روي ميانگين: بعضاً مجموعه اي از داده ها ممكن است شامل چند عدد خيلي كوچك و يا چند عدد حقيقي بزرگ باشد، كــــه آنها را ” دادة پرت” مي گويند. به طور كلي اندازه هائي كه مقدار آنها در ميقايسه با اكثر داده ها بسيار كوچك و يا بسيار بزرگ مي باشد را داده پرت و يا مقادير فرين مي گويند. يك از معايب ميانگين به عنوان اندازه مركزي حساسيت آن به داده هاي پرت است كه براي رفع اين مشكل معيار ميانه به كار برده مي شود.

يكي از اندازه هاي مهم مركزي مي باشد كه به صورت زير تعريف مي شود. ميانه مجموعه اي از داده ها، كه آن را با m یاMd نشان مي دهند، اندازه اي است كه حداقل نيمي از داده ها از آن عدد كمتر باشند.
محاسبه میانه برای داده های گسسته:
براي محاسبه ميانه با استفاده از داده هاي خام به ترتيب زير عمل مي كنيم.
١- داده ها را به ترتيب صعودي يا نزولي مرتب مي كنيم
٢- به داده هاي مرتب شده رتبه اختصاص مي دهيم به طوريكه به اولين عدد رتبه 1 ، و به آخرين عدد رتبه n يا تعلق مي گيرد.

٣- چنانچه n فرد باشدداده وسط یا وچنانچه n زوج باشد ميانه ميانگين دو داده وسطی است یا:          
مثال1: میانه داده های زیر را بدست آورید:
77, 79, 80, 86, 87, 87, 94, 99
حل:داده ها 8 تا است. با توجه به اینکه داده ها مرتب هستند،بنابراین میانه داده ها
برابراست با:
مثال2: میانه داده های زیر را بدست آورید:
80, 75, 90, 95, 65, 65, 85, 70, 100
حل: ابتدا داده ها را از کوچک به بزرگ مرتب می نماییم.
65, 65, 70, 75, 80, 85, 90, 95, 100
تعداد داده ها برابر با 9 است. ،بنابراین میانه داده ها عبارت است از

محاسبه میانه برای داده های جدول فراوانی:
مقدار ميانه را نيز مي توان با استفاده از جدول فراواني محاسبه نمود
براي بدست آوردن ميانه با استفاده از جدول فراواني ق
دمهاي زير را بر مي‌داريم
١- اولين طبقه يا رده اي كه فراواني تجمعي آن بزرگتر يا مساوي است را تعيين و آن را طبقه يا رده ميانه مي ناميم.
٢- چنانچه از جدول فراواني رده بندي شده (داده های گسسته)استفاده مي كنيم اندازه ميانه همان رده ميانه است و چنانچه از جدول فراواني طبقه بندي استفاده مي شود ميانه تقريبي از رابطه زير بدست مي آيد.

كه در اين رابطه : حد طبقه پايين طبقه ميانه=
   فراواني تجمعي طبقه قبل از طبقه ميانه=
فراواني طبقه ميانه=
       طول طبقه = I می باشند
فرمول فوق با فرض يكنواختي در داخل هر طبقه و بر اساس يك تناسب ساده به دست مي آيد.(چرا؟)
ميانه نيز مركز هيستوگرام را تعيين مي كند به طوريكه معمولاً نصف داده ها در طرف راست و نصف ديگر در طرف چپ آن قرار مي گيرند.
مزيت ميانه به عنوان يك اندازه مركزي بر ميانگين در اين است كه
ميانه تحت تأثير داده هاي پرت قرار نمي گيرد، اما از طرف ديگر با توجه به اينکه ميانه از اندازه همه داده ها به دست نمي آيد معيار قابل قبولي براي بسياري از بررسي هاي آماري نيست.

نما ترجمه كلمه مد است، كه يك لغت فرانسوي و به معناي متداول ترين است. نما، براي مجموعه اي از داده‌ها عبارتست از اندازه اي كه بيشترين فراواني را دارا مي باشد. برخلاف ميانگين و ميانه كه براي مجموعه اي از داده‌ها وجود داشته و يكتا است، نما، لزوماً چنين خاصيتي را ندارد. اگر فراواني داده ها يكسان باشد، توزيع آنها نما ندارد. به عبارت دیگر داده ها بدون نما هستند.
اگر دو اندازه از داده ها فراواني يكسان و بيشترين فراواني را داشته باشند توزع آنها دو نمائي است. به همين ترتيب ممكن است توزيع چند نمائي براي مجموعه اي از داده ها داشته باشيم. نما را با حرف
M یا Mo نمایش می دهیم.
شکل منحنی های یک نمایی و دو نمایی

محاسبه نما برای داده های گسسته:
١- پیدا کردن فراوانی داده ها
٢- داده ای که فراوانی آن بیشتر باشد را به عنوان نما انتخاب می کنیم.
توضیح: اگر دو داده دارای فراوانی مساوی باشند،بیشتر از سایر فراوانی ها، هر دو را به عنوان نما انتخاب می کنیم. مشروط بر اینکه این دو داده کنار هم نباشند. اگر کنار هم بودند، نصف مجموع آنها را نما می خوانیم.
مثال: برای داده های 3،1،3،1،3،1،3،2،4،5،3،3،1 نما برابر است با M=3 .
مثال: برای داده های 1،1،3،2،1،4،3،3،5 دو داده 1 و 3 که کنار هم نیستند و فراوانی مشترک آنها بیش از سایر فراوانی هاست، هر دو به عنوان نما اختیار می شوند.
مثال: برای داده های1،3،1،1،2،1،3،2،2،4،5،2 نصف دو داده 1 و 2 که کنار هم می باشند و دارای فراوانی 4 (بیش از سایر فراوانی ها) هستند به عنوان نما اختیار می شود. یعنی

محاسبه نما برای داده های پیوسته:
١- خلاصه کردن داده ها در یک جدول فراوانی
٢- نماینده رده ای را که دارای فراوانی بیشتر می باشد و رده نمایی نامیده می شود را به عنوان نما اختیار می کنیم.
برای دقت بیشتر می توان نما را از فرمول



بدست آورد. در فرمول نما،

مرز پایین رده نمایی =

اختلاف فراوانی های نسبی رده نمایی و رده بلافاصله قبل از آن =

اختلاف فراوانی های نسبی رده نمایی و رده بلافاصله بعد از آن=

طول رده می باشد =

50 - 59

40 - 49

30 - 39

20 - 29

10 - 19

 

10

40

20

17

12

 

مثال :

طبقه مد­دار

 

نکته: اگر در جدول توزیع فراوانی­ها فراوانی طبقات ما قبل و ما بعد طبقه نمادار مساوی باشند، نماینده طبقه نمادار را نما بدانید.

22 - 24

19 - 21

16 - 18

13 - 15

10 - 14

 

8

16

8

12

10

 

مثال :

طبقه نمادار

 

مقايسه اندازه هاي مركزي ميانگين، ميانه و نما:

براي مجموعه اي از داده ها نمي توان به سادگي نتيجه گرفت كه كداميك از اندازه هاي مركزي ميانگين، ميانه و نما بهترين معيار است. لذا در اين قسمت به ويژگيها و موارد استفاده آنها اشاره مي شود تا استفاده كننده با شناخت بهتري بتواند معيار مناسب را انتخاب نمايد.
الف) ميانگين حسابي
١- ميانگين با استفاده از ارزش همه داده ها محاسبه مي گردد.
٢- مقدار ميانگين نسبت به دو معيار ديگر در نمونه گيري هاي متفاوت از يك جمعیت كمتر تغيير مي‌يابد .
٣- از ميانگين براي محاسبه معيارهاي پراكندگي استفاده مي شود.
٤- ميانگين را نمي توان براي يك جدول توزيع فراواني كه طبقه اول و طبقه آخر آن محدود نمي باشند محاسبه نمود.
٥- ميانگين براي مجموعه اي از داده ها يكتا است.
٦- اندازه ميانگين تحت تأثير مقادير بسيار بزرگ و يا مقادير بسيار كوچك قرار مي گيرد و به همين دليل مي تواند معيار مركزي نامناسبي باشد.
ب) ميانه
١- ميانه زماني محاسبه مي گردد كه نياز به شناخت ارزش مياني داده ها باشد.
٢- براي تشخيص اينكه اندازه اي از داده ها در نيمه بالا و يا نيمه پايين توزيع قرار مي گيرد، محاسبه ميانه لازم است.
٣- ميانه معيار مركزي مناسبي براي داده هاي جدول توزيع فراواني است كه طبقه اول و طبقه آخر آن محدود نيست.
٤- ميانه كمتر تحت تأثير مقادير بسيار كوچك و بسيار بزرگ قرار مي گيرد.
ج) نما
١- براي تعيين متداول ترين اندازه داده ها از معيار نما استفاده مي شود.
٢- محاسبه معيار مركزي نما از ساير معيارها ساده تر است
٣- نما را مي توان به عنوان يك معيار مركزي براي داده هاي كيفي نيز به كار برد

٤- ممكن است براي مجموعه اي از داده ها نما وجود نداشته باشد و يا بيش از يك نما موجود باشد.

ميانگين وزني

در برخي از داده ها براي محاسبه ميانگين حسابي، به دليل اينكه مقادير مشاهده شده ارزش هاي متفاوت دارند لازم است به هر مشاهده وزني را اختصاص داده و سپس ميانگين داده هاي وزن داده شده را محاسبه نمود.
ميانگين وزني از فرمول زير محاسبه مي شود

ميانگين پيراسته

همانگونه كه پيش از اين ذكر شد اندازه ميانگين تحت تأثير مقادير بسيار بزرگ و يا مقادير بسيار كوچك قرار مي گيرد و به همين دليل مي تواند معيار مركزي نامناسبي باشد در چنين شرايطي شايد مناسب باشد از معيار ميانگين پيراسته كه از از تاثير مقادير فرين مصون مي‌باشد استفاده نماييم.
يك ميانگين پيراستة
كه با نمايش داده ميشود به ميانگين حسابي گفته ميشود كه پس از كنار گذاردن نسبت از مشاهدات دو انتهاي مجموعة دادة مرتب شده محاسبه شود. براي محاسبه ميانگين پيراسته با استفاده از داده هاي خام به ترتيب زير عمل مي كنيم.
١- داده ها را به ترتيب صعودي يا نزولي مرتب مي كنيم
٢- به داده هاي مرتب شده رتبه اختصاص مي دهيم به طوريكه به اولين عدد رتبه 1 ، و به آخرين عدد رتبه n يا تعلق مي گيرد.

٣- مقدار صحيح عبارت را محاسبه مي‌كنيم و مي‌ناميم
٤- ميانگين حسابي مشاهدات را بدون در نظر گرفتن مشاهده از اول و آخر داده های مرتب شده محاسبه‌ مي‌كنيم

ميانگين هارمونيك یا توافقی

ميانگين هارمونيك به صورت عكس ميانگين معكوس اندازه ها تعريف شده است. در صورتی که همگی غیرصفر باشند، ميانگين هارمونيك از رابطه زير به دست مي آيد.

كاربرد اين ميانگين در موارد خاص مي باشد. مثلاً براي محاسبه متوسط سرعت اتومبيل وقتي كه اتومبيل فاصله بين دو شهر را با سرعت هاي متفاوت طي مي كند، به طور کلی در مواردی که واحد اندازه گیری مرکب است استفاده می شود.

فرض كنيد راننده اي مسافت 100 كيلومتر را با سرعت 80 كيلومتر در ساعت طي مي كند و در برگشت همان مسافت را با سرعت 90 كيلومتر در ساعت، در اين صورت سرعت متوسط رانند 85 كيلومتر در ساعت نيست زيرا


یعنی سرعت متوسط برابر با:                                                                                                                          


كه با استفاده از ميانگين هارمونيك نيز نتيجه فوق حاصل مي شود.:

به طور كلي ميانگين هارمونيك زماني استفاده مي شود که مشاهدات به صورت معكوس براي ميانگين مورد نظر بيان شده اند. مثلاً اگر متوسط قيمت يك كالا خواسته شود و اطلاعات به صورت تعداد كالاها براي يك قيمت معين داده شده باشد، از ميانگين هارمونيك استفاده مي شود. این میانگین در بینایی سنجی و مطالعه شبکه های برق نیز کار برد دارد.

ميانگين هندسي

ميانگين هندسي معيار مركزي مناسب براي داده هايي از نوع درصد، نسبت، نرخ، شاخص ها و غيره است. براي محاسبه ميانگين هندسي، در صورتی که همگی مثبت باشند و به ترتیب فراوانی مطلق آنها باشند به نحوی کهf1+f2+f3+…+fk=N از استفاده مي شود.
برای محاسبه این میانگین آسانتر است که قبلا لگاریتم آن راحساب کرد. لگاریتم این میانگین برابر است با میانگین حسابی

این میانگین به صورت
تعریف می شود و در حقیقت برابر است با جذر میانگین حسابی
.
می توان ثابت کرد که میان چهار نوع میانگین حسابی، هندسی، توافقی و رتبه دو، رابطه زیر برقرار است:

   چندک:

به عدد Qp که از %px100 داده ها بزرگتر و از%(1-p)x100 دادها کوچکتر باشد چندک مرتبه p ام گفته می شود. Q0.63 داده ای است که از %63 داده ها بزرگتر و از%37 داده ها کوچکتر است.

معروفترین چندک ها عبارتند از چهارک ها ،دهک ها و صدک ها

چهارک : دادها را به چهار قسمت تقسیم می کنند.و آنها را با علامت q3 q2, q1چهارک اول ،چهارک دوم،چهارک سوم نشان می دهند .چهارک دوم همان میانه است. واضح است که q1= Q0.25و q2= Q0. 5و q3= Q0.75 به چهارک سوم سه قد نیز می گویند.

دهک ها: دادها را به ده قسمت تقسیم می کنند.و آنها را با علامت, D9,…D1, D2, D3 دهک اول ،دهک دوم،دهک سوم و...و دهک نهم نشان می دهند. دقت کنید که دهک پنجم همان میانه است.

واضح است که : D1= Q0.1 وD2= Q0. 2و D3= Q0.3 و ...و D9= Q0.9

صدک ها: دادها را به صد قسمت تقسیم می کنند.و آنها را با علامت, P99,…P1, P2, P3 صدک اول ،صدک دوم،صدک سوم و...و صدک نودو نهم نشان می دهند. دقت کنید که صدک پنجا هم همان میانه است.

واضح است که : P1= Q0.01 و P2= Q0. 02و P3= Q0.03 و ...و P99= Q0.99

محاسبه چندک در داده های گسسته:

برای محاسبه چندک مرتبه Pام ابتدا حاصل ضرب p در تعداد داده ها به اضافه یک را محاسبه می کنیم یعنی:

r.w =(N+1) X P قسمت صحیح این حاصل ضرب r و قسمت اعشاری را w می نامیم. حال داده ها را از کوچک به بزرگ مرتب می کنیم و به آنها رتبه می دهیم چندک مرتبه Pام از فرمول زیر به دست می آید:

محاسبه چندک در داده های پیوسته:

ابتدا طبقه چندک را به دست می آوریم و آن اولین طبقه ایست که فراوانی تجمعی آن از N X p بزگتر یا مساوی با آن باشد.سپس از فرمول استفاده می کنیم كه در اين رابطه :

حد طبقه پايين طبقه چندک=
فراواني تجمعي طبقه قبل از طبقه چندک=

فراواني طبقه چندک=

طول طبقه =
I
مثال : مقداردهک هشتم رابرای داده های
18 و 10 و 11 و 17 و 19 و 20 و 17 و 12 و 16 و 14 بدست آورید:

دهک هشتم همان پس p=0.8 و N=10 در نتیجه (N+1) X p=11X 0.8=8.8 بنا براین r=8 وw=0.8

 
 

داده ها را از کوچک به بزرگ مرتب می کنیم:             20 و 19 و 18 و 17 و 17 و 16 و 14 و 12 و 11 و 10

داریم             :

در جدول فراوانی زیر مقدار میانه وچهارک سوم را بدست آورید.

میانه: ابتدا طبقه میانه را بدست می آوریم.اولین طبقه ای که فراوانی تجمعی آن از نصب داده ا یعنی عدد 20 بزرگتر است که طبقه سوم است پس:

Si

ri

Fi

fi

mi  

حدود طبقات(دسته)

6/40

6/40

6

6

13.99

12.845 - 15.135

13/40

7/40

13

7

16.28

15.135 - 17.425

25/40

12/40

25

12

18.57

17.425 - 19.715

29/40

4/40

29

4

20.86

19.715 - 22.005

طبقه میانه

34/40

5/40

34

5

23.15

22.005 - 24.295

40/40

6/40

40

6

25.44

24.295 - 26.585

 

1    

 

40

 

         مجموع

طبقه چهارک سوم


برای محاسبه چهارک سوم میدانیم که همان Q0.75است.اول طبقه چندک را بدست می آوریم.اولین طبقه ای که فراوانی تجمعی آن از0.75x40=30 بزرگتر باشد که طبقه پنجم است پس:

معیار های پراکندگی:

فرض کنید نمرات دو کلاس در درس آمار و احتمال مهندسی به شرح زیر است:

12

12

9

10

16

11

10

4

کلاس A

9

12

12

9

10

11

10

11

کلاس B

میانگین هر دو کلاس برابر 10.5 است .اما می توان گفت دو کلاس شرایط یکسانی دارند؟

بنا براین به نظر می رسد معیار های مرکزی به تنهایی نتواند جهت مقایسه به کار برده شوندو نیاز به شاخصی داریم که بتواند داده ها از نظر پراکندگی و نحوه توزیع مورد بررسی قرار دهد.معروفترین معیار های پراکندگی عبارتند از:

1-               دامنه تغییرات   2 واریانس     3- انحراف از معیار   4-ضریب چولگی     5-ضریب کشیدگی

دامنه تغییرات:اختلاف بین بزرگترین داده آماری و کوچکترین داده آماری را دامنه تغییرات گویند.

چنانچه داده­های آماری گرد شده باشند دامنه تغییرات برابر است با:

واریانس: میانگین مربع انحرافات از میانگین را واریانس گویند و فرمول محاسبه آن عبارت است از:

که در آن میانگین حسابی و تعداد داده ها می باشد :                                

با توجه به پیچیدگی محاسباتی فرمول بالا می توان از فرمول مقابل استفاده کرد:          

تذکر: وقتی با نمونه ای ازیک جامعه کار می کنیم از فرمول استفاده می شود. دلیل این امر در آمار استنباطی در بخش خواص برآورد گر ها گفته خواهد شد. از این به بعد تا رسیدن به بخش آمار استنباطی منظور ما از واریانس همان فرمول اول خواهد بود.

انحراف از معیار:در فرمول واریانس به دلیل به توان دو رسیدن انحرافات هم علامت آنها مثبت می شود و هم انحراف از میانگین هر داده بهتر نشان داده می شود.اما مشکلی که ایکاد می شود این است که واحد اندازه کیری داده ها نیز به توان دو می رسد و این موضوع باعث می شود که تفسیر عدد به دست آمده از فرمول واریانس مشکل شود.بنابراین از واریانس جدر گرفته می شود . و به مقدار مثبت این جذر انحراف از معیار گفته می شود که واحد اندازه گیری آن همان واحد اولیه داده ها محسوب می شود.آن را با علامت نشان می دهند.

منحنی نرمال:در این توزيع شکل داده ها متقارن و شبیه به یک زنگوله است و شاخص های میانه، میانگین و نما بر هم منطبق اند.

در این توزیع اگر میانگین را با و انحراف از معیار را با نشان دهیم داریم:

در حدود 68 درصد داده‌ها در فاصله  قرار دارند.

در حدود 95 درصد داده‌ها در فاصله    قرار دارند.

در حدود 99 درصد داده‌ها در فاصله  قرار دارند.

مثال: توزیع نمرات يك درس دانشجویان تقریبا نرمال است. اگر ميانگين نمرات آنها 15 و واريانس نمرات 25/2 باشد، فاصله ای را که شامل 68 درصد نمره های دانشجویان است تعیین مي كنيم:

تقريباً 68 درصد نمرات در فاصله (5/16 و 5/13) قرار دارند، زيرا:

نکته:اگر در توزیع نرمال میانگین صفر و واریانس 1 باشد به آن توزیع نرمال استاندارد می کویند

چولگی:

رابطه بين معيارهاي مركزي ميانگين، ميانه و نما براي توزيع هاي متقارن و چوله به شرح زير مي باشد.
١- براي مجموعه اي از داده ها با هيستوگرام یا منحنی نرمال متقارن و يك نمائي، مقادير ميانگين، ميانه و نما يكسان بوده و در مركز توزيع قرار دارند.این داده ها دارای توزیع نرمال هستند.

 

٢- براي هيستوگرامي كه چوله به راست مي باشد، مقدار ميانگين بزرگترين اندازه و نما كوچكترين اندازه مركزي و ميانه بين اين دو اندازه قرار دارد. دليل بزرگ بودن ميانگين، تأثير اندازه هاي بسيار بزرگ در طرف راست هيستوگرام مي باشد.

 

٣- براي هيستوگرامي كه چوله به چپ است. ميانگين كوچكترين اندازه و نما بزرگترين اندازه را دارا است و ميانه بين اين دو اندازه قرار مي گيرد.

 

هرگاه میزان چولگی خفیف باشد، بین میانگین و میانه و مد، رابطه تقریبی زیر برقرار است:

اگر از
و و سه خط موازی محور ها رسم کنیم، از نظر هندسی خطی که ازمد رسم می شود از نقطه ماکزیمم منحنی فراوانی می گذرد، خطی که از رسم می شود مساحت زیر منحنی فراوانی را نصف می کند و خطی که از میانگین می گذرد محور تعادل منحنی را مشخص می سازد.

اما باید بدانیم که یک هیستوگرام یا منحنی فراوانی چه میزان به چپ یا به راست چوله است. برای اندازه گیری میزان چولگی می توان از فرمول های زیر استفاده کرد:

ضریب اول چولگی پیرسن:          ضریب دوم چولگی پیرسن:

ضریب چولگی گشتاوری: که در آن گشتاور مرتبه سوم حول میانگین نام دارد.

1- اگر ضریب چو لگی منفی باشد منحنی چوله به چپ است.

2- اگر ضریب چو لگی مثبت باشد منحنی چوله به چپ است.

3-اگر قدر مطلق ضریب چولگی کوچکتر از 0.1 باشد توزیع داده ها نرمال است.

4- اگر قدر مطلق ضریب چولگی بزرگتر از 0.1 و کوچکتر از 0.5 باشد توزیع داده ها تقریبا نرمال است.

5- اگر قدر مطلق ضریب چولگی بزرگتر از 0.5 باشد توزیع داده ها نرمال نیست.

برجستگی و کشیدگی:

اگر واریانس داده ها از واریانس توزیع نرمال کوچکتر باشد منحنی را کشیده(پخ) و اگر واریانس داده ها از واریانس توزیع نرمال بزرگتر باشد منحنی را برجسته(نوک تیز) گویند.

برای اندازه گیری کشیدگی و برجستگی از فرمول ضریب برجستگی گشتاوری استفاده می شود. که در آن گشتاور مرتبه چهارم حول میانگین نام دارد.

1- اگر ضریب برجستگی منفی باشد منحنی کشیده است.

2- اگر ضریب برجستگی مثبت باشد منحنی برجسته است.

3-اگر قدر مطلق ضریب برجستگی کوچکتر از 0.1 باشد توزیع داده ها نرمال است.

4- اگر قدر مطلق ضریب برجستگی بزرگتر از 0.1 و کوچکتر از 0.5 باشد توزیع داده ها تقریبا نرمال است.

5- اگر قدر مطلق ضریب برجستگی بزرگتر از 0.5 باشد توزیع داده ها نرمال نیست.

ضریب تغییر (CV): معیاری است که از میانگین و واریانس هم زمان برای مقایسه عملکرد دو یا چند جامعه استفاده می کند هر چه کوچکتر باشد وضعیت آن جامعه بهتر است.

مثال:فرض کنیدمیانگین نمرات کلاس ریاضی 14 و واریانس آن 9 و میانگین کلاس فیزیک 16 و واریانس آن 12 باشد کدام معلم بهتر عمل کرده است؟          و کلاس ریاضی بهتر است چون CV آن کمتر است

نمرات استانداردشده(z score):

بارها شده است که شما نمره کم در یک درس با یک استاد خاص را نسبت به نمره ای بالا در همان درس با استادی دیگر ارزشمند تر دانسته اید.یا از معدل پایین خود در یک گروه سخت گیر یا رشته سخت اعتراض داشته اید یا سواد خود را بهتر می دانسته اید.یا به خاطرهمان معدل پایین علی رغم سطح علمی بهتر در یک شرایط استخدامی به خاطر وجود حد نصاب معدل رد شده اید. تمام این موارد با استفاده از نمرات استاندارد قابل حل شدن است . می توان ویا بهتر بگوییم باید برای مقایسه افراد در دو یا چند جامعه متفاوت از نمرات استاندارد استفاده کرد کافی است داده ها را از میانگین کم و بر انحراف استاندارد تقسیم کنیم تا نمرات استاندارد یا Z score ساخته شوند هرچه این نمرات بزرگتر باشند بهتر است.

مثال : فرض کنیدمیانگین نمرات کلاس ریاضی 14 و واریانس آن 9 و میانگین کلاس فیزیک 16 و واریانس آن 12 باشد. دانش آموزی که در ریاضی نمره 9 ودر فیزیک نمره 10 کسب کرده در کدام درس بهتر است؟

و پس این دانشجو در درس ریاضی بهتر است! چون نمره استاندارد بیشتری دارد.

مثال: برای داده های زیر میانگین، واریانس ،ضریب چولگی گشتا وری و ضریب برجستگی گشتاوری را بدست آورید:

48

44

24

36

32

28

24

 

8

6

5

4

8

6

5

 

با توجه به فرمول هاجدول زیر را تشکیل می دهیم :

           

24976.9

-1986.8

2880

120

5

24

5397.751

-629.738

4704

168

6

28

436.7247

-95.5335

8192

256

8

32

0.106622

-0.18659

5184

144

4

36

138.1824

40.30321

8000

200

5

40

3045.238

409.9359

11616

264

6

44

17059.56

1492.711

18432

384

8

48

51054.46

-769.306

59008

1536

42

مجموع

حال از جدول اعداد را جایگزین می کنیم:

به نظر شما این محاسبات طاقت فرسا نیست؟آیا می توان آنها را کوتاه کرد؟

روش کوتاه:

ابتدا چند قانون در مورد میانگین و واریانس را بررسی می کنیم:

1-اگر به تک تک داده ها عددی ثابت اضافه کنیم میانگین داده های جدید برابر است با آن مقدار ثابت به اضافه میانگین داده های اولیه

اما واریانس داده ها بدون تغییر می ماند.

فرض کنید داده های اولیه باشند به تک تک آنها عددa را اضافه می کنیم داده های جدید عبارتند از:

2- اگراز تک تک داده ها عددی کم کنیم میانگین داده های جدید برابر است با میانگین داده های اولیه منهای آن عدد ثابت اما واریانس داده ها بدون تغییر می ماند.

برای اثبات مشابه بالا عمل می کنیم فقط به جای + از علامت استفاده می شود.

3-اگر تک تک داده ها را در عددی ضرب کنیم .میانگین جدید عبارت است از میانگین داده ها ضربدر آن عددو واریانس داده های جدید عبارت است از واریانس داده های قدیم ضربدر توان دوم آن عدد.

4- اگرتک تک داده ها را بر عددی تقسیم کنیم .میانگین جدید عبارت است از میانگین داده ها ضربدرتقسیم بر آن عدد و واریانس داده های جدید عبارت است از واریانس داده های قدیم تقسیم بر توان دوم آن عدد.

برای اثبات مشابه بالا عمل می کنیم فقط به جای از علامت استفاده می شود.

با استفاده از قوانین بالا می توان ابتدا تبدیلی روی داده ها انجام داد تا داده ها کوچکتر شوند.سپس برای داده ها ی جدید میانگین و واریانس را محاسبه کرد و در پایان میانگین و واریانس داده های اصلی را بدست آورد.

که در آن معمولا را نشان (نماینده) دسته مد و b را طول رده در نظر می گیرند.

آیا می توانید قوانینی مشابه برای ضریب چولگی گشتاوری و ضریب برجستگی گشتاوری بیابید؟

برای مثال قبلی با روش کوتاه میانگین و واریانس را بدست می آوریم:

a=32 وb=4 پس                                                                        

       

20

-10

-2

5

24

12

-6

-1

6

28

0

0

0

8

32

4

4

1

4

36

20

10

2

5

40

48

18

3

6

44

128

32

4

8

48

232

48

5

42

مجموع

پیگیری سفارشات


لطفا شماره سفارش خود را وارد نمایید