مقدمه
دید کلی
موضوع آمار عبارت است از هنر و علم جمع آوری ، تعبیر و تجزیه و تحلیل دادهها و استخراج تعمیمهای منطقی در مورد پدیدههای تحت بررسی و با توجه به مراحل اساسی یک تحقیق علمی ، آشکار است که آمار بطور وسیعی در قلمرو تمام تحقیقات علمی بکار میرود.
آمار علم و عمل توسعه دانش انسانی از طریق استفاده از دادههای تجربی است. آمار بر نظریهی آمار مبتنی است که شاخهای از ریاضیات کاربردی است. در نظریهی آمار، اتفاقات تصادفی و عدم قطعیت توسط نظریه احتمال مدل میشوند. عمل آماری، شامل برنامهریزی، جمعبندی، و تفسیر مشاهدات غیر قطعی است. از آنجا که هدف آمار این است که از دادههای موجود «بهترین» اطلاعات را تولید کند، بعضی مؤلفین آمار را شاخهای از نظریهی تصمیمگیری به شمار میآورند.
نقش آمار در مراحل اساسی پژوهش علمی
در مرحله جمع آوری اطلاعات ، آمار راهنمای محقق در انتخاب روشها و وسایل مناسب برای جمع آوری دادههای اطلاعاتی است. این راهنمایی ، مشتمل است بر تعیین نوع و میزان دادهها. بطوری که نتیجههای حاصل از تجزیه و تحلیل دادهها را بتوان با درجه دقت مورد نظر بیان کرد. در زمینههایی از مطالعات که انجام آزمایشها پرخرج است، نوع و مقدار دادههای لازم برای بدست آوردن نتیجههایی که از میزان اعتبار مطلوب برخوردار باشند، باید به دقت از قبل تعیین شود. در زمینههای دیگر نیز ، این امر از لحاظ اعتبار نهایی و موثر بودن نتایج حاصل از تحلیل دادهها ، اهمیت دارد. شاخهای از آمار که با طرح ریزی آزمایشها و گردآوری دادهها سروکار دارد، طرح آزمایش یا طرح نمونه گیری نامیده میشود.
در مراحل بعد از گردآوری دادهها ، نیاز بیشتری به روشهای آماری وجود دارد. دستهای از این روشها برای خلاصه کردن اطلاعات موجود در دادهها طرح ریزی میشوند تا توجه ما روی ویژگیهای مهم دادهها متمرکز گردد و جزئیات غیر ضروری کنار گذاشته شوند. دسته مهمتری از روشها ، در تجزیه و تحلیل دادهها ، برای استخراج نکات کلی و استنباطهایی درباره پدیده تحت مطالعه بکار میروند. آن دسته از روشهای آماری که با تلخیص و توصیف ویژگیهای برجسته دادهها سروکار دارند، در مبحث آمار توصیفی قرار میگیرند. برخلاف گذشته ، امروزه آمار توصیفی فقط قسمت کوچکی از حوزه فعالیتهایی است که تحت پوشش موضوع آمار قرار میگیرند.
در زمان حاضر ، قسمت عمده موضوع آمار عبارت است از کسب اطلاعات با انجام محاسباتی روی دادهها ، و ارزیابی معلومات تازهای که از این اطلاعات بدست میآید. این قسمت از قلمرو آمار را آمار استنباطی و روشهای مربوط به آن را استنباط آماری مینامند. استفاده از این روشها پایهای برای استدلال بدست میدهد تا بتوانیم واقعیات مشاهده شده را بطور منطقی تعبیر نماییم، تعیین کنیم که این واقعیات تا چه حدی مدل مفروضی را تایید یا آن را نقض میکنند. و پیشنهادهایی برای اصلاح نظریه موجود ، و یا شاهد طرح ریزی تحقیقات دیگری ارائه دهیم.
نقش آمار در تحقیقات اجتماعی- اقتصادی
در بسیاری از قلمروهای جامعه شناسی ، اقتصاد ، علوم سیاسی ، مطالعاتی در زمینههای مربوط به رفاه اقتصادی گروههای قومی گوناگون ، هزینههای مصرف کنندگان در سطوح مختلف درآمد و نظرات گوناگون در هنگام وضع یک قانون در زمینههایی نظیر اینها انجام میگیرد. این مطالعات نوعا بر مبنای دادههایی انجام میگیرد که از راه مصاحبه یا تماس با نمونهای از افراد بدست میآید، که این نمونه بوسیله روشهای آماری از کل جامعهای که قلمرو مطالعه را تشکیل میدهد، انتخاب میشوند. سپس این دادهها مورد تجزیه و تحلیل قرار میگیرند و تعبیراتی از موضوع مورد نظر به عمل میآید.
نقش آمار در برنامههای تربیتی و آموزشی
برنامههای تربیتی و آموزشی که برای انواع متقاضیان (از قبیل دانشجویان دانشگاه ، کارگران کارخانه ، گروههای اقلیت ، افراد ناقصالعضو ، کودکان عقب افتاده) در بسیاری از زمینهها طرح میشوند، دائما مورد بررسی ، ارزیابی و اصلاح قرار میگیرند تا سودمندی آنها برای جامعه افزایش یابد. برای کسب اطلاع از کارایی برنامههای مختلف در مقایسه با یکدیگر ، ضرورت دارد که دادههایی درباره موفقیتها یا رشد مهارت افرادی که برنامه در مورد آنها اجرا میگردد، گردآوری شود.
نتیجه گیری
قسمتهای مختلف آمار مباحث کاملا مجزایی نیستند که هر یک از آنها برای استفاده در یکی از مراحل تحقیق در نظر گرفته شده باشند، بلکه مجموعه به هم پیوستهای از فعالیتها را تشکیل میدهند، بطوری که روشهایی که در یک قسمت بکار میروند، ارتباط زیادی با روشهای مورد استفاده در قسمتهای دیگر دارند. برای تصمیم گیری راجع به چگونگی فرآیند و میزان جمع آوری دادهها ، باید درکی از روشهای استنباطی که در نظر داریم بکار ببریم. و نیز توانایی استنباط مطلوب ، داشته باشیم.
از طرف دیگر ، روشهای تجزیه و تحلیل دادهها و استخراج نتایج ، به شدت به فرآیند مولد دادهها بستگی دارند. میتوان گفت که آمار مجموعهای از مفاهیم و روشهاست که در هر زمینه پژوهش ، برای گردآوری و تعبیر اطلاعات مربوط به آن و انجام نتیجه گیریها ، در شرایطی که عدم حتمیت و تغییر وجود دارد، بکار میرود.
تاریخچه
سرآغاز اولیه آمار را باید در شمارش های آماری حوالی آغاز قرن اول میلادی یافت. اما ،تنها در قرن هجدهم بود که این علم ، با به کار رفتن در توصیف جنبه هایی که شرایط یک وضعیت را مشخص میکردند ، به عنوان رشته ای علمی و مستقل شروع به مطرح شدن کرد.
مفهوم از کلمه لاتینی ،به معنی شرط ، استخراج شده است. مدت های مدید ، این علم ، محدود به کار در این حوزه بود ، و تنها در دهه های اخیر از این انحصاری جدا شدو ، و به کمک نظریه احتمال ،شروع به بررسی روش های تحلیل داده های آماری و اثبات فرض های آماری کرد.
روش های این آمار ریاضی با آشکار کردن قوانین جدید ، به ابزاری موثر در علوم طبیعی و تکنولوژی تبدیل شد.
جامعه و نمونه
جامعه یک بررسی آماری دارای مشاهده ها یا آزمایش هایی تحت شرایطی یکسان ، به عنوان عنصرهای خود است. هر یک از این عنصرها را میتوان نسبت به مشخصه های متفاوتی بررسی کرد ، که می توانند به عنوان متغیرهای تصادفی XوY .... در نظر گرفته شوند.
اگر مشخصه تحت بررسی X ، دارای تابع توزیع F در جامعه مربوط باشد ، آنگاه گفته می شود که جامعه مورد بحث دارای توزیع F نسبت به مشخصه X است. در بررسی های آماری همواره زیر مجموعه ای متناهی از عناصر جامعه مورد تحقیق قرار می گیرد.این زیر مجموعه به نمونه موسوم است ، و n، تعداد عناصر موجود در آن ، اندازه نمونه نامیده می شود.
مثال
اگر وزن پسر بچه های ده ساله متغیر تصادفی x باشد ، در این صورت تمام پسر بچه های به این سن یک جامعه تشکیل می دهند . اندازه های وزن پسربچه های در شماری از مکان ها یک نمونه می سازند ، و هر پسر بچه عنصری از جامعه مزبور است . وزن مورد بحث مشخصه ای از عنصر های مزبور به شمار می رود ، و سایر مشخصه ها ، به عنوان مثال ، بلندی قد و اندازه سینه اند.
طرح آزمایش
در بررسی یک مسئله با روش های آماری ، باید نقشه آزمایش کشیده شود که شامل روش جمع آوری داده ها،اندازه نمونه مورد نظر و روش حل آن مسئله است. در این مورد هر چه نقشه آزمایش دقیق تر باشد ، نتایج به دست آمده از روش های آماری بهتر خواهند بود . بخصوص ، باید اطمینان حاصل شود که هیچ یک از اندازه گیری هایی که برای نتایج مورد نظر دارای اهمیت اند از قلم نیفتند یا ناقص نباشند . اما در این مورد همچنین می توان ، تنها به همان اندازه که می شود با بخش ناچیزی از هزینه ها به دست آورد قناعت و از دستاوردی با یک رشته آزمون بسیار پرخرج اجتناب کرد.
در این رابطه ، نکات زیر از اهمیت برخوردارند:
· مواد یا اطلاعات بررسی شده باید همگن باشند ؛ یعنی ،· روش آزمون ،· در دوره بررسی ،· باید یکسان باقی بماند. در وسایل یا شرایط تولید نباید تغییری داده شود ،· و ابزارهای اندازه گیری با دقت های متفاوت نباید به کار روند.
· بایدتا آنجا که امکان دارد خطاهای منظم یا عوامل موثر کنار گذاشته شوند . به عنوان مثال ،· اگر مایل باشیم دو ماده را با هم مقایسه کنیم ،· باید هر دو را در یک دستگاه تهیه کرده باشیم ،· چه در غیر این صورت تفاوت دستگاه ها در نتایج بررسی وارد می شود ،· و در کشاورزی ،· در آزمون کودهای متفاوت ،· باید زمین را ،· به خاطر یکسان کردن تاثیر نوع خاک و موقعیت آن ،· به باریکه های موازی تقسیم کرد.
باید نظارتی در نظر گرفته شود. در این مورد، یا برای مشخصه تحت بررسی مقادیر استانداردی موجودند ،که می توانند با نتایج آزمون مقایسه شوند ، یا آزمونهای نظارتی باید انجام گیرند . به عنوان مثال ، در آزمایش مربوط به کودها ، باید تاثیر یک کود از تفاوت بین گیاهانی که که با آن یا بدون آن ،تحت شرایط محیطی یکسان ،رشد کرده اند ، ارزیابی شود.
انتخاب نمونه باید تصادفی یا نماینده ای باشد . انتخاب تصادفی انتخابی است که در آن هر عنصر برای اینکه عضو آن نمونه باشد یا نباشد ، از احتمال یکسان برخوردار است. به عنوان مثال ، در یک محموله پیچ ، نمونه مورد آزمون نباید تماماَ از یک مکان انتخاب شود ،بلکه باید روی کل محموله توزیع شده باشد ، و در اندازه گیری ضخامت سیم ها نقاط اندازه گیری شده باید به طور تصادفی روی تمام طول سیم توزیع شده باشد.
انتخاب تصادفی عناصر را می توان به کمک جداول اعداد تصادفی انجام داد ، و انتخاب نماینده ای نمونه را می توان زمانی انجام داد که ماده تحت بررسی را بتوان به گونه ای یکتا به اجزایی تقسیم کرد . به عنوان مثال ، امکان پذیر است که یک محموله پیچ را به چنان طریقی تقسیم کنیم که هر جزء مزبور ، به تصادف انتخاب کرد ، ودر این صورت کل آنها نمونه مورد نظر را تشکیل می دهند. به این طریق تصویری از محموله ، بر مبنای مقیاسی کاهش یافته به دست می آید.
با توجه به اندازه نمونه مورد آزمون ، البته باید به بررسی مورد بزرگ تر و استنتاج بهتر ، درباره جامعه ای که از آن می توان ساخت ، پرداخت ،اما از طرف دیگر ، اندازه مزبور ، به دلایل زمانی و تلاش به کار رفته ، معمولاَ کوچک در نظر گرفته می شود، بنابر این باید انحرافی تصادفی از نتایج را نیز به حساب بیاوریم. هنگامی که ، با روش های آماری ، استنتاجاتی درباره جامعه ای به دست می آوریم باید اندازه نمونه مورد آزمون را نیز در نظر بگیریم.
از این گفته ها میتوان به اهمیت تحصیل در رشته آمار و نیاز جامعه به فارغ التحصیلان این رشته پی برد.
برای تعیین توزیعهای آماری لازم است دو نوع فضای احتمال تعریف شود:
1- فضای نمونهای را که تعداد عنالصر آن متناهی یا بطور شمارش پذیر نامتناهی باشد، فضای نمونه گسسته گوییم.
2- وقتی فضای نمونه شامل تمام اعداد متعلق به یک فاصله باشد، آن را فضای نمونه پیوسته گوییم.
انواع توزیعهای احتمال
توزیع احتمال یک متغیر تصادفی گسته ، یا بطور خلاصه ، توزیع یک متغر تصادفی عبارت است از فهرست مقادیر Xi از متغیر تصادفی X همراه با احتمال منسوب به هر یک از این مقادیر ، (f(xi) = P(X=Xi. اغلب می توان به جای استفاده از یک فهرست مفصل، از یک فرمول استفاده کرد.
2- تابع چگالی احتمال (f(x ، توزیع احتمال یک متغیر تصادفی پیوسته را توصیف میکند و دارای خواص زیر است.
الف) مساحت کل زیر منحنی چگالی برابر با یک است.
ب) مساحت زیر منحنی چگالی بین b,a مساوی است با (P(a≤x≤b
ج) (f(x مثبت یا صفر است.
انواع توزیعهای احتمال گسسته
امتحان برنولی (موفقیت شکست)
در اینجا تکرارهای متوالی یک آزمایش یا مشاهده را مورد بررسی قرار میدهیم و هر تکرار را یک امتحان مینامیم.
به علاوه فرض میکنیم که برای هر امتحان فقط دو برآمد ممکن وجود دارد. که یکی از آنها را موفقیت و دیگری را شکست مینامند بر این تاکید شده باشد که آنها تنها برآمدهای ممکناند.
ویژگیهای امتحان برنولی
الف) هر امتحان به یکی از دو برآمد ممکن میانجامد که در اصطلاح فنی موقعیت و شکسیت نامیده میشوند.
ب) برای تمام امتحانها ، احتمال موفقیت p ، یکی است. بنابراین احتمال شکست برای هر امتحان q=1-p است که آن را با q نشان میدهید، بطوری که p+q=1
ج) امتحانها مستقل از یکدیگرند. احتمال موفقیت در یک احتمال با داشتن هر مقدار اطلاعات از برآمدهای سایر احتمالها ، تغییر نمیکند.
د) احتمالهای برنولی به صورت P(X=x) = pxq1-x تعریف می شود. دارای میانگین p (احتمال موفقیت) و واریانس pq (احتمال موفقیت در احتمال شکست) میباشد.
توزیع دو جملهای
در حالتی که n امتحان مرکدر برنولی (n عدد ثابت) انجام میشوند و احتمال موفقیت در هر امتحان p است. توزیع دو جملهای عبارت است از تعداد موفقیتهای در n امتحان.
توزیع دو جملهای را به صورت
px(1-p)1-x (ترکیب x شیء از n شیء) = (P(X=x) = b(x;n;p برای تمایز n,…,2,1,0 تعریف میشود. اصطلاح توزیع دو جملهای از قضیه مهمی در جبر به نام قضیه بسط دو جملهای ، که مربوط است به فرمول بسط a+b)n) گرفته شده است توزیع دو جملهای دارای میانگین np (تعداد موفقیتهای در n امتحان) و واریانس npq (تعداد موفقیتها در n امتحان ضرب در احتمال شکستها) میباشد.
توزیع فوق هندسی
فرض کنید میخواهیم نمونه گیری را از یک جامعه N عنصری انجام دهیم که خود میتواند به دو گروه تقسیم شود، گروهی که مشخصه معینی دارند و بقیه که دارای چنین مشخصهای نیستند. این دو گروه میتوانند مثلا ، نر به ماده ، شاغل- بیکار ، سالم- معیوب و نظایر اینها باشند. با پذیرش اصطلاحات سالم و معیوب برای توصیف این دو گروه ، تعداد معیوبها در جامعه را با D نشان میدهیم، بنابراین تعداد عناصر سالم N-D خواهد بود. سپس فرض میکنیم X ، نشاندهنده تعداد معیوبها در نمونه تصادفی n عنصری باشد. توزیع فوق هندسی به صورت x=0,1,…,n و
(ترکیبn از N شی)/(ترکیب n-x از N-D شی) (ترکیب x از D شی) = (P(X=x تعریف میشود. دارای میانگین np ، که در آن P=D/N (نسبت معیوبهای جامعه) ، و واریانس (ndq(N-n)/N-1 میباشد.
توزیع هندسی یا زمان انتظار
توزیع هندسی ، توزیع گسسته دیگری است که در مبحث امتحانهای برنولی پیش میآید. وقتی تعداد امتحانها معین باشد، تعداد موفقیتها متغیری با توزیع دو جملهای (b(n,p است. اگر به جای اینکه تعداد امتحانها از قبل معین باشد، بخواهیم امتحانهای برنولی را تا به دست آوردن اولین موفقیت تکرار کنیم، تعداد موفقیتهای عدد معین 1 است ولی تعداد احتمالها متغیر تصادفی است. X عبارت است از تعداد امتحان های برنولی تا به دست آوردن اولین موفقیت. توزیع هندسی به صورت
p(X=x)=q1-xp , X=0,1,…,n تعریف میشود. دارای میانگین p-1 و واریانس q/p2 میباشد.
توزیع هندسی را گاهی توزیع زمان انتظار گسسته میگویند. این امر ناشی از این واقعیت است که اگر انجام یک امتحان برنولی یک واحد زمان طول بکشد، زمان انتظار برای به دست آوردن اولین موفقیت ، دقیقا عبارت است از متغیر تصادفی x که دارای توزیع هندسی است. توزیع هندسی اغلب برای مطالعه یک مشخصه کمیاب جامعه ، نظیر وجود نوعی بیماری خونی کمیاب ، مفید است.
پیامدهای کمیاب و توزیع پواسن
توزیع پواسن برای ساختن مدل بسیاری از پدیدههای شانسی مفید است. همچنین تقریبی از احتمالهای دو جملهای را به دست میدهد. توزیع پواسن علاوه بر نقشی که به عنوان یک توزیع تقریب کننده دارد، مدل احتمال مفیدی است برای پیشامدهایی که بطور تصادفی در زمان یا مکان رخ میدهند، هنگامی که دانستهها منحصر به متوسط تعداد رخدادهای آنها در واحد زمان یک مکان باشد. برای پیشامدی که در زمان اتفاق میافتد، هر لحظه از زمان را میتوان احتمال بالقوهای دانست که در آن ، پیشامد ممکن است رخ بدهد یا رخ ندهد. در یک واحد زمان، بطور بالقوه تعداد متناهی احتمال وجود دارد، ولی معمولا پیشامدها به دفعات اندکی اتفاق میافتد.
توزیع پواسن به صورت x=0,1,…,n و !P(X=x) = e-mmx/x تعریف میشود که e عدد نمایی و برابر 71828/2 است.
توزیعهای احتمال پیوسته
توزیع نرمال یا توزیع گوس
توزیع نرمال ، که ممکن است بعضی از خوانندگان نمودار آن را به عنوان منحنی زنگدیس بشناسند، گاهی با نامهای پیر لاپلا س و کارل گاوس که در تاریخ پیدایش آن نقش چشمگیری داشتهاند، همراه است. گاوس توزیع نرمال را با روش ریاضی به عنوان توزیع احتمال خطای اندازهگیریها به دست آورد و آن را "قانون نرمال خطاها" نامید. توزیع نرمال نقشی اساسی در آمار بازی میکند، و روشهای استنباطی که از آن به دست میآیند، دارای قلمرو کاربرد وسیعی هستند و ستون فقرات روشهای جاری تجزیه و تحلیل آماری را تشکیل میدهند.
توزیع نرمال دارای چگالی e-(x-µ)2/2σ2/σ√2π میباشد. که در آن µ میانگین و σ انحراف معیار است به صورت (N(µ,σ2 نشان داده میشود.
· اگر انحراف معیار با میانگین 0 و انحراف معیار 1 باشد آن را توزیع نرمال استاندارد می· گویند و به صورت (N(0,1 نشان می· دهند،· دارای توزیع Z = (x-µ)/σ می· باشد.
· قضیه حد مرکزی: برای توزیع میانگین نمونه مبتنی بر نمونه· ای تصادفی به حجم n ،· میانگین (X) برابر µ ،· واریانس (X) برای σ2/n یا (n/ واریانس جامعه) ،· انحراف معیار (X) برابر σ/√n یا (n√/انحراف معیار جامعه) می· باشد. طبق قضیه حد مرکزی توزیع نرمال به صورت Z = (X- µ) / σ/√n تقریبا (N(0,1 است.
موضوع تحقیق:
دبیرمحترم : جناب آقای اشتری
دبیرستان غیرانتفایی سبحان
محقق و نویسنده:سید میلاد کماریزاده
کلاس:1/2
منبع:
http://daneshnameh.roshd.ir