آمار

مقدمه

دید کلی
موضوع آمار عبارت است از هنر و علم جمع آوری ، تعبیر و تجزیه و تحلیل داده‌ها و استخراج تعمیمهای منطقی در مورد پدیده‌های تحت بررسی و با توجه به مراحل اساسی یک تحقیق علمی ، آشکار است که آمار بطور وسیعی در قلمرو تمام تحقیقات علمی بکار می‌رود.
آمار علم و عمل توسعه دانش انسانی از طریق استفاده از داده‌های تجربی است. آمار بر نظریه‌ی آمار مبتنی است که شاخه‌ای از ریاضیات کاربردی است. در نظریه‌ی آمار، اتفاقات تصادفی و عدم قطعیت توسط نظریه احتمال مدل می‌شوند. عمل آماری، شامل برنامه‌ریزی، جمع‌بندی، و تفسیر مشاهدات غیر قطعی است. از آنجا که هدف آمار این است که از داده‌های موجود «بهترین» اطلاعات را تولید کند، بعضی مؤلفین آمار را شاخه‌ای از نظریه‌ی تصمیم‌گیری به شمار می‌آورند.
نقش آمار در مراحل اساسی پژوهش علمی
در مرحله جمع آوری اطلاعات ، آمار راهنمای محقق در انتخاب روشها و وسایل مناسب برای جمع آوری داده‌های اطلاعاتی است. این راهنمایی ، مشتمل است بر تعیین نوع و میزان داده‌ها. بطوری که نتیجه‌های حاصل از تجزیه و تحلیل داده‌ها را بتوان با درجه دقت مورد نظر بیان کرد. در زمینه‌هایی از مطالعات که انجام آزمایشها پرخرج است، نوع و مقدار داده‌های لازم برای بدست آوردن نتیجه‌هایی که از میزان اعتبار مطلوب برخوردار باشند، باید به دقت از قبل تعیین شود. در زمینه‌های دیگر نیز ، این امر از لحاظ اعتبار نهایی و موثر بودن نتایج حاصل از تحلیل داده‌ها ، اهمیت دارد. شاخه‌ای از آمار که با طرح ریزی آزمایشها و گردآوری داده‌ها سروکار دارد، طرح آزمایش یا طرح نمونه گیری نامیده می‌شود.
در مراحل بعد از گردآوری داده‌ها ، نیاز بیشتری به روشهای آماری وجود دارد. دسته‌ای از این روشها برای خلاصه کردن اطلاعات موجود در داده‌ها طرح ریزی می‌شوند تا توجه ما روی ویژگیهای مهم داده‌ها متمرکز گردد و جزئیات غیر ضروری کنار گذاشته شوند. دسته مهمتری از روشها ، در تجزیه و تحلیل داده‌ها ، برای استخراج نکات کلی و استنباطهایی درباره پدیده تحت مطالعه بکار می‌روند. آن دسته از روشهای آماری که با تلخیص و توصیف ویژگیهای برجسته داده‌ها سروکار دارند، در مبحث آمار توصیفی قرار می‌گیرند. برخلاف گذشته ، امروزه آمار توصیفی فقط قسمت کوچکی از حوزه فعالیتهایی است که تحت پوشش موضوع آمار قرار می‌گیرند.

در زمان حاضر ، قسمت عمده موضوع آمار عبارت است از کسب اطلاعات با انجام محاسباتی روی داده‌ها ، و ارزیابی معلومات تازه‌ای که از این اطلاعات بدست می‌آید. این قسمت از قلمرو آمار را آمار استنباطی و روشهای مربوط به آن را استنباط آماری می‌نامند. استفاده از این روشها پایه‌ای برای استدلال بدست می‌دهد تا بتوانیم واقعیات مشاهده شده را بطور منطقی تعبیر نماییم، تعیین کنیم که این واقعیات تا چه حدی مدل مفروضی را تایید یا آن را نقض می‌کنند. و پیشنهادهایی برای اصلاح نظریه موجود ، و یا شاهد طرح ریزی تحقیقات دیگری ارائه دهیم.

نقش آمار در تحقیقات اجتماعی- اقتصادی
در بسیاری از قلمروهای جامعه شناسی ، اقتصاد ، علوم سیاسی ، مطالعاتی در زمینه‌های مربوط به رفاه اقتصادی گروههای قومی گوناگون ، هزینه‌های مصرف کنندگان در سطوح مختلف درآمد و نظرات گوناگون در هنگام وضع یک قانون در زمینه‌هایی نظیر اینها انجام می‌گیرد. این مطالعات نوعا بر مبنای داده‌هایی انجام می‌گیرد که از راه مصاحبه یا تماس با نمونه‌ای از افراد بدست می‌آید، که این نمونه بوسیله روشهای آماری از کل جامعه‌ای که قلمرو مطالعه را تشکیل می‌دهد، انتخاب می‌شوند. سپس این داده‌ها مورد تجزیه و تحلیل قرار می‌گیرند و تعبیراتی از موضوع مورد نظر به عمل می‌آید.

نقش آمار در برنامه‌های تربیتی و آموزشی
برنامه‌های تربیتی و آموزشی که برای انواع متقاضیان (از قبیل دانشجویان دانشگاه ، کارگران کارخانه ، گروههای اقلیت ، افراد ناقص‌العضو ، کودکان عقب افتاده) در بسیاری از زمینه‌ها طرح می‌شوند، دائما مورد بررسی ، ارزیابی و اصلاح قرار می‌گیرند تا سودمندی آنها برای جامعه افزایش یابد. برای کسب اطلاع از کارایی برنامه‌های مختلف در مقایسه با یکدیگر ، ضرورت دارد که داده‌هایی درباره موفقیتها یا رشد مهارت افرادی که برنامه در مورد آنها اجرا می‌گردد، گردآوری شود.

نتیجه گیری
قسمتهای مختلف آمار مباحث کاملا مجزایی نیستند که هر یک از آنها برای استفاده در یکی از مراحل تحقیق در نظر گرفته شده باشند، بلکه مجموعه به هم پیوسته‌ای از فعالیتها را تشکیل می‌دهند، بطوری که روشهایی که در یک قسمت بکار می‌روند، ارتباط زیادی با روشهای مورد استفاده در قسمتهای دیگر دارند. برای تصمیم گیری راجع به چگونگی فرآیند و میزان جمع آوری داده‌ها ، باید درکی از روشهای استنباطی که در نظر داریم بکار ببریم. و نیز توانایی استنباط مطلوب ، داشته باشیم.

از طرف دیگر ، روشهای تجزیه و تحلیل داده‌ها و استخراج نتایج ، به شدت به فرآیند مولد داده‌ها بستگی دارند. می‌توان گفت که آمار مجموعه‌ای از مفاهیم و روشهاست که در هر زمینه پژوهش ، برای گردآوری و تعبیر اطلاعات مربوط به آن و انجام نتیجه گیریها ، در شرایطی که عدم حتمیت و تغییر وجود دارد، بکار می‌رود.

تاریخچه
سرآغاز اولیه آمار را باید در شمارش های آماری حوالی آغاز قرن اول میلادی یافت. اما ،تنها در قرن هجدهم بود که این علم ، با به کار رفتن در توصیف جنبه هایی که شرایط یک وضعیت را مشخص میکردند ، به عنوان رشته ای علمی و مستقل شروع به مطرح شدن کرد.
مفهوم از کلمه لاتینی ،به معنی شرط ، استخراج شده است. مدت های مدید ، این علم ، محدود به کار در این حوزه بود ، و تنها در دهه های اخیر از این انحصاری جدا شدو ، و به کمک نظریه احتمال ،شروع به بررسی روش های تحلیل داده های آماری و اثبات فرض های آماری کرد.
روش های این آمار ریاضی با آشکار کردن قوانین جدید ، به ابزاری موثر در علوم طبیعی و تکنولوژی تبدیل شد.

جامعه و نمونه
جامعه یک بررسی آماری دارای مشاهده ها یا آزمایش هایی تحت شرایطی یکسان ، به عنوان عنصرهای خود است. هر یک از این عنصرها را میتوان نسبت به مشخصه های متفاوتی بررسی کرد ، که می توانند به عنوان متغیرهای تصادفی XوY .... در نظر گرفته شوند.
اگر مشخصه تحت بررسی X ، دارای تابع توزیع F در جامعه مربوط باشد ، آنگاه گفته می شود که جامعه مورد بحث دارای توزیع F نسبت به مشخصه X است. در بررسی های آماری همواره زیر مجموعه ای متناهی از عناصر جامعه مورد تحقیق قرار می گیرد.این زیر مجموعه به نمونه موسوم است ، و n، تعداد عناصر موجود در آن ، اندازه نمونه نامیده می شود.
مثال
اگر وزن پسر بچه های ده ساله متغیر تصادفی x باشد ، در این صورت تمام پسر بچه های به این سن یک جامعه تشکیل می دهند . اندازه های وزن پسربچه های در شماری از مکان ها یک نمونه می سازند ، و هر پسر بچه عنصری از جامعه مزبور است . وزن مورد بحث مشخصه ای از عنصر های مزبور به شمار می رود ، و سایر مشخصه ها ، به عنوان مثال ، بلندی قد و اندازه سینه اند.
طرح آزمایش
در بررسی یک مسئله با روش های آماری ، باید نقشه آزمایش کشیده شود که شامل روش جمع آوری داده ها،اندازه نمونه مورد نظر و روش حل آن مسئله است. در این مورد هر چه نقشه آزمایش دقیق تر باشد ، نتایج به دست آمده از روش های آماری بهتر خواهند بود . بخصوص ، باید اطمینان حاصل شود که هیچ یک از اندازه گیری هایی که برای نتایج مورد نظر دارای اهمیت اند از قلم نیفتند یا ناقص نباشند . اما در این مورد همچنین می توان ، تنها به همان اندازه که می شود با بخش ناچیزی از هزینه ها به دست آورد قناعت و از دستاوردی با یک رشته آزمون بسیار پرخرج اجتناب کرد.
در این رابطه ، نکات زیر از اهمیت برخوردارند:
· مواد یا اطلاعات بررسی شده باید همگن باشند ؛ یعنی ،· روش آزمون ،· در دوره بررسی ،· باید یکسان باقی بماند. در وسایل یا شرایط تولید نباید تغییری داده شود ،· و ابزارهای اندازه گیری با دقت های متفاوت نباید به کار روند.

· بایدتا آنجا که امکان دارد خطاهای منظم یا عوامل موثر کنار گذاشته شوند . به عنوان مثال ،· اگر مایل باشیم دو ماده را با هم مقایسه کنیم ،· باید هر دو را در یک دستگاه تهیه کرده باشیم ،· چه در غیر این صورت تفاوت دستگاه ها در نتایج بررسی وارد می شود ،· و در کشاورزی ،· در آزمون کودهای متفاوت ،· باید زمین را ،· به خاطر یکسان کردن تاثیر نوع خاک و موقعیت آن ،· به باریکه های موازی تقسیم کرد.

باید نظارتی در نظر گرفته شود. در این مورد، یا برای مشخصه تحت بررسی مقادیر استانداردی موجودند ،که می توانند با نتایج آزمون مقایسه شوند ، یا آزمونهای نظارتی باید انجام گیرند . به عنوان مثال ، در آزمایش مربوط به کودها ، باید تاثیر یک کود از تفاوت بین گیاهانی که که با آن یا بدون آن ،تحت شرایط محیطی یکسان ،رشد کرده اند ، ارزیابی شود.

انتخاب نمونه باید تصادفی یا نماینده ای باشد . انتخاب تصادفی انتخابی است که در آن هر عنصر برای اینکه عضو آن نمونه باشد یا نباشد ، از احتمال یکسان برخوردار است. به عنوان مثال ، در یک محموله پیچ ، نمونه مورد آزمون نباید تماماَ از یک مکان انتخاب شود ،بلکه باید روی کل محموله توزیع شده باشد ، و در اندازه گیری ضخامت سیم ها نقاط اندازه گیری شده باید به طور تصادفی روی تمام طول سیم توزیع شده باشد.

انتخاب تصادفی عناصر را می توان به کمک جداول اعداد تصادفی انجام داد ، و انتخاب نماینده ای نمونه را می توان زمانی انجام داد که ماده تحت بررسی را بتوان به گونه ای یکتا به اجزایی تقسیم کرد . به عنوان مثال ، امکان پذیر است که یک محموله پیچ را به چنان طریقی تقسیم کنیم که هر جزء مزبور ، به تصادف انتخاب کرد ، ودر این صورت کل آنها نمونه مورد نظر را تشکیل می دهند. به این طریق تصویری از محموله ، بر مبنای مقیاسی کاهش یافته به دست می آید.
با توجه به اندازه نمونه مورد آزمون ، البته باید به بررسی مورد بزرگ تر و استنتاج بهتر ، درباره جامعه ای که از آن می توان ساخت ، پرداخت ،اما از طرف دیگر ، اندازه مزبور ، به دلایل زمانی و تلاش به کار رفته ، معمولاَ کوچک در نظر گرفته می شود، بنابر این باید انحرافی تصادفی از نتایج را نیز به حساب بیاوریم. هنگامی که ، با روش های آماری ، استنتاجاتی درباره جامعه ای به دست می آوریم باید اندازه نمونه مورد آزمون را نیز در نظر بگیریم.
از این گفته ها میتوان به اهمیت تحصیل در رشته آمار و نیاز جامعه به فارغ التحصیلان این رشته پی برد.

برای تعیین توزیعهای آماری لازم است دو نوع فضای احتمال تعریف شود:
1- فضای نمونه‌ای را که تعداد عنالصر آن متناهی یا بطور شمارش پذیر نامتناهی باشد، فضای نمونه گسسته گوییم.
2- وقتی فضای نمونه شامل تمام اعداد متعلق به یک فاصله باشد، آن را فضای نمونه پیوسته گوییم.

انواع توزیعهای احتمال
توزیع احتمال یک متغیر تصادفی گسته ، یا بطور خلاصه ، توزیع یک متغر تصادفی عبارت است از فهرست مقادیر Xi از متغیر تصادفی X همراه با احتمال منسوب به هر یک از این مقادیر ، (f(xi) = P(X=Xi. اغلب می توان به جای استفاده از یک فهرست مفصل، از یک فرمول استفاده کرد.
2- تابع چگالی احتمال (f(x ، توزیع احتمال یک متغیر تصادفی پیوسته را توصیف می‌کند و دارای خواص زیر است.
الف) مساحت کل زیر منحنی چگالی برابر با یک است.
ب) مساحت زیر منحنی چگالی بین b,a مساوی است با (P(a≤x≤b
ج) (f(x مثبت یا صفر است.

انواع توزیعهای احتمال گسسته
امتحان برنولی (موفقیت شکست)
در اینجا تکرارهای متوالی یک آزمایش یا مشاهده را مورد بررسی قرار می‌دهیم و هر تکرار را یک امتحان می‌نامیم.
به علاوه فرض می‌کنیم که برای هر امتحان فقط دو برآمد ممکن وجود دارد. که یکی از آنها را موفقیت و دیگری را شکست می‌نامند بر این تاکید شده باشد که آنها تنها برآمدهای ممکن‌اند.

ویژگیهای امتحان برنولی
الف) هر امتحان به یکی از دو برآمد ممکن می‌انجامد که در اصطلاح فنی موقعیت و شکسیت نامیده می‌شوند.
ب) برای تمام امتحانها ، احتمال موفقیت p ، یکی است. بنابراین احتمال شکست برای هر امتحان q=1-p است که آن را با q نشان می‌دهید، بطوری که p+q=1
ج) امتحانها مستقل از یکدیگرند. احتمال موفقیت در یک احتمال با داشتن هر مقدار اطلاعات از برآمدهای سایر احتمالها ، تغییر نمی‌کند.
د) احتمالهای برنولی به صورت P(X=x) = pxq1-x تعریف می شود. دارای میانگین p (احتمال موفقیت) و واریانس pq (احتمال موفقیت در احتمال شکست) می‌باشد.

توزیع دو جمله‌ای
در حالتی که n امتحان مرکدر برنولی (n عدد ثابت) انجام می‌شوند و احتمال موفقیت در هر امتحان p است. توزیع دو جمله‌ای عبارت است از تعداد موفقیتهای در n امتحان.
توزیع دو جمله‌ای را به صورت
px(1-p)1-x (ترکیب x شیء از n شیء) = (P(X=x) = b(x;n;p برای تمایز n,…,2,1,0 تعریف می‌شود. اصطلاح توزیع دو جمله‌ای از قضیه مهمی در جبر به نام قضیه بسط دو جمله‌ای ، که مربوط است به فرمول بسط a+b)n) گرفته شده است توزیع دو جمله‌ای دارای میانگین np (تعداد موفقیتهای در n امتحان) و واریانس npq (تعداد موفقیتها در n امتحان ضرب در احتمال شکستها) می‌باشد.

توزیع فوق هندسی
فرض کنید می‌خواهیم نمونه گیری را از یک جامعه N عنصری انجام دهیم که خود می‌تواند به دو گروه تقسیم شود، گروهی که مشخصه معینی دارند و بقیه که دارای چنین مشخصه‌ای نیستند. این دو گروه می‌توانند مثلا ، نر به ماده ، شاغل- بیکار ، سالم- معیوب و نظایر اینها باشند. با پذیرش اصطلاحات سالم و معیوب برای توصیف این دو گروه ، تعداد معیوبها در جامعه را با D نشان می‌دهیم، بنابراین تعداد عناصر سالم N-D خواهد بود. سپس فرض می‌کنیم X ، نشاندهنده تعداد معیوبها در نمونه تصادفی n عنصری باشد. توزیع فوق هندسی به صورت x=0,1,…,n و
(ترکیبn از N شی)/(ترکیب n-x از N-D شی) (ترکیب x از D شی) = (P(X=x تعریف می‌شود. دارای میانگین np ، که در آن P=D/N (نسبت معیوبهای جامعه) ، و واریانس (ndq(N-n)/N-1 می‌باشد.

توزیع هندسی یا زمان انتظار
توزیع هندسی ، توزیع گسسته دیگری است که در مبحث امتحانهای برنولی پیش می‌آید. وقتی تعداد امتحانها معین باشد، تعداد موفقیتها متغیری با توزیع دو جمله‌ای (b(n,p است. اگر به جای اینکه تعداد امتحانها از قبل معین باشد، بخواهیم امتحانهای برنولی را تا به دست آوردن اولین موفقیت تکرار کنیم، تعداد موفقیتهای عدد معین 1 است ولی تعداد احتمالها متغیر تصادفی است. X عبارت است از تعداد امتحان های برنولی تا به دست آوردن اولین موفقیت. توزیع هندسی به صورت
p(X=x)=q1-xp , X=0,1,…,n تعریف می‌شود. دارای میانگین p-1 و واریانس q/p2 می‌باشد.

توزیع هندسی را گاهی توزیع زمان انتظار گسسته می‌گویند. این امر ناشی از این واقعیت است که اگر انجام یک امتحان برنولی یک واحد زمان طول بکشد، زمان انتظار برای به دست آوردن اولین موفقیت ، دقیقا عبارت است از متغیر تصادفی x که دارای توزیع هندسی است. توزیع هندسی اغلب برای مطالعه یک مشخصه کمیاب جامعه ، نظیر وجود نوعی بیماری خونی کمیاب ، مفید است.

پیامدهای کمیاب و توزیع پواسن
توزیع پواسن برای ساختن مدل بسیاری از پدیده‌های شانسی مفید است. همچنین تقریبی از احتمالهای دو جمله‌ای را به دست می‌دهد. توزیع پواسن علاوه بر نقشی که به عنوان یک توزیع تقریب کننده دارد، مدل احتمال مفیدی است برای پیشامدهایی که بطور تصادفی در زمان یا مکان رخ می‌دهند، هنگامی که دانسته‌ها منحصر به متوسط تعداد رخدادهای آنها در واحد زمان یک مکان باشد. برای پیشامدی که در زمان اتفاق می‌افتد، هر لحظه از زمان را می‌توان احتمال بالقوه‌ای دانست که در آن ، پیشامد ممکن است رخ بدهد یا رخ ندهد. در یک واحد زمان، بطور بالقوه تعداد متناهی احتمال وجود دارد، ولی معمولا پیشامدها به دفعات اندکی اتفاق می‌افتد.

توزیع پواسن به صورت x=0,1,…,n و !P(X=x) = e-mmx/x تعریف می‌شود که e عدد نمایی و برابر 71828/2 است.

توزیعهای احتمال پیوسته
توزیع نرمال یا توزیع گوس
توزیع نرمال ، که ممکن است بعضی از خوانندگان نمودار آن را به عنوان منحنی زنگدیس بشناسند، گاهی با نامهای پیر لاپلا س و کارل گاوس که در تاریخ پیدایش آن نقش چشمگیری داشته‌اند، همراه است. گاوس توزیع نرمال را با روش ریاضی به عنوان توزیع احتمال خطای اندازه‌گیریها به دست آورد و آن را "قانون نرمال خطاها" نامید. توزیع نرمال نقشی اساسی در آمار بازی می‌کند، و روشهای استنباطی که از آن به دست می‌آیند، دارای قلمرو کاربرد وسیعی هستند و ستون فقرات روشهای جاری تجزیه و تحلیل آماری را تشکیل می‌دهند.

توزیع نرمال دارای چگالی e-(x-µ)2/2σ2/σ√2π می‌باشد. که در آن µ میانگین و σ انحراف معیار است به صورت (N(µ,σ2 نشان داده می‌شود.
· اگر انحراف معیار با میانگین 0 و انحراف معیار 1 باشد آن را توزیع نرمال استاندارد می‌· گویند و به صورت (N(0,1 نشان می‌· دهند،· دارای توزیع Z = (x-µ)/σ می‌· باشد.

· قضیه حد مرکزی: برای توزیع میانگین نمونه مبتنی بر نمونه‌· ای تصادفی به حجم n ،· میانگین (X) برابر µ ،· واریانس (X) برای σ2/n یا (n/ واریانس جامعه) ،· انحراف معیار (X) برابر σ/√n یا (n√/انحراف معیار جامعه) می‌· باشد. طبق قضیه حد مرکزی توزیع نرمال به صورت Z = (X- µ) / σ/√n تقریبا (N(0,1 است.

موضوع تحقیق:

دبیرمحترم : جناب آقای اشتری

دبیرستان غیرانتفایی سبحان

محقق و نویسنده:سید میلاد کماریزاده
کلاس:1/2
منبع:

http://daneshnameh.roshd.ir

سید میلاد پنج‌شنبه 21 تیر‌ماه سال 1386 ساعت 01:30

ریاضیات و سرگرمی

پیوندها

دسته‌ها

جدیدترین یادداشت‌ها

بایگانی

آمار