آمار رشته وسیعی از ریاضی است که راههای جمع آوری، خلاصه سازی و نتیجه گیری از دادهها را مطالعه میکند. این علم برای طیف وسیعی از علوم دانشگاهی از فیزیک وعلوم اجتماعی گرفته تا روان شناسی و غیره کاربرد دارد.. آمار، دانش استخراج اطلاعات از دادههای جمعآوری شدهاست. دادهها ممکن است به صورت کمی (عدد و رقم) یا کیفی (صفت و ویژگی غیرعددی) جمعآوری شده باشند. دستهبندی و خلاصهسازی این دادهها کمک میکند بتوانیم اطلاعات بیشتری از آنها استخراج کنیم. میتوان علم آمار را مرتبط با شیوهها و روشهای دستهبندی، خلاصه سازی، تحلیل و استنباط دادهها دانست.
آمار عمدتا با وضعیت هابی سر و کار دارد که در آنها وقوع یک پیشامد به طور حتمی قابل پیش بینی نیست. استنتاج های آماری غالبا غیر حتمی اند، زیرا مبتنی بر اطلاعات ناکاملی هستند.
اصول پایه ای
جمعآوری دادهها، از طریق پرسشنامه یا اندازهگیری با ابزار یا شمارش و مصاحبه و… انجام میشود. بعد از این عمل، دستهبندی و خلاصهسازی برای ویژگیهای اندازهگیری شده اهمیت دارد. استفاده از جداول آماری مانند جدول فراوانی، جدول فراوانی متقاطع، نمودارها و غیره روشهایی برای دسته بندیدادهها هستند. نمودارهای فراوانی (هیستوگرام)، نمودار پارتو، نمودار جعبهای و نمودارهای دیگر، قابلیت نمایش خصوصیات جامعه آماری را به صورت تصویری دارند. همچنین برای شناخت بهتر جامعه آماری یا نمونه آماری، امکان محاسبه شاخصها یا معیارهایی وجود دارد که به وسیلهی آن خصوصیات جامعه یا نمونه در یک مقدار (کمی یا کیفی) خلاصه شده، و مقایسه بین جامعهها یا نمونههای مختلف را میسر میسازد.
هر پژوهش دارای دو وجه است؛ یکی طرح آزمایش و انجام آن و دیگری تـحلیل آماری داده ها که این دو موضوع در ارتباط نزدیک با یکدیگرند؛ زیرا تحلیل مستقیما به طرح مورد استفاده بستگی دارد. در طرح آزمایش چند نکته حایز اهمیت است:
- تکرار: منظور از تـکرار تهیه مشاهدات متـعدد در امتحان واحدهای آزمایش است . تکرار دو خاصیت مهم دارد :
- پژوهشگر را قادر می سازد که برآوردی از خطای آزمایش به دست آورد؛
- اگر بـرای برآورد سطحی از یک عامل به طور مثال از میانگین نمونه استفاده کنیم آن گاه تکرار موجب برآوری دقیق تر برای آن اثر می شود.
- تصـادفی کردن: منـظور از تـصادفی کردن تـخصیص تصادفی تیمارها به واحدهای آزمایشی است.
- بلوک بندی: تکنیکی است که برای افزایش دقت یک آزمایش استفاده می شود. استفاده از آن موجب می شود که علی رغم محدودیـت های واقـعی از انتـخاب تـصادفی واحدهای آزمـایشی بتـوانیم خطای آزمـایش را کاهش دهیم.
جمعآوری دادهها، از طریق پرسشنامه-اندازهگیری با ابزار اندازهگیری یا شمارش-مصاحبه و… انجام میشود. بعد از این عمل، دستهبندی و خلاصهسازی برای ویژگیهای اندازهگیری شده اهمیت دارد. استفاده از جداول آماری مانند جدول فراوانی، جدول فراوانی متقاطع، نمودارها و غیره روشهایی برای دسته بندیدادهها هستند. نمودارهای فراوانی (هیستوگرام)، نمودار پارتو، نمودار جعبهای و نمودارهای دیگر، قابلیت نمایش خصوصیات جامعه آماری را به صورت تصویری دارند. همچنین برای شناخت بهتر جامعه آماری یا نمونه آماری، امکان محاسبه شاخصها یا معیارهایی وجود دارد که بوسیلهی آن خصوصیات جامعه یا نمونه در یک مقدار (کمی یا کیفی) خلاصه شده، و مقایسه بین جامعهها یا نمونههای مختلف را میسر میسازد.
روشهای آماری
هدف کلی برای یک پروژه تحقیقی آماری، بررسی حوادث اتفاقی بوده هم چنین نتیجه گیری روی تأثیر تغییرات در ارزش شاخصها یا متغیرهای غیر وابسته روی یک پاسخ یا متغیر وابستهاست. دو شیوه اصلی از مطالعات آماری تصادفی وجود دارد: مطالعات تجربی و مطالعات مشاهداتی. در هر دو نوع از این مطالعات، اثر تغییرات در یک متغیر (یا متغیرهای) غیر وابسته روی رفتار متغیرهای وابسته مشاهده میشود. اختلاف بین این دو شیوه درچگونگی مطالعهای است که عملا هدایت میشود. یک مطالعه تجربی در بردارنده روشهای اندازه گیری سیستم تحت مطالعهاست که سیستم را تغییر میدهد و سپس با استفاده از روش مشابه اندازه گیریهای اضافی انجام میدهد تا مشخص سازد که آیا تغییرات انجام شده، مقادیر شاخصها را تغییر میدهد یا خیر. در مقابل یک مطالعه نظری، مداخلات تجربی را در بر نمیگیرد. در عوض دادهها جمع آوری میشوند و روابط بین پیش بینیها و جواب بررسی میشوند. از جمله مهمترین اهداف آمار، میتوان تولید بهترین اطلاعات از دادههای موجود و سپس استخراج دانش از آن اطلاعات را ذکر کرد.
جامعه و نمونه
جامعه یک بررسی آماری دارای مشاهده ها یا آزمایش هایی تحت شرایطی یکسان ، به عنوان عنصرهای خود است. هر یک از این عنصرها را میتوان نسبت به مشخصه های متفاوتی بررسی کرد ، که می توانند به عنوان متغیرهای تصادفی XوY .... در نظر گرفته شوند. انتخاب نمونه باید تصادفی یا نماینده ای باشد . انتخاب تصادفی انتخابی است که در آن هر عنصر برای اینکه عضو آن نمونه باشد یا نباشد ، از احتمال یکسان برخوردار است.
حجم نمونه:
در انجام تحلیلهای آماری، در بیشتر مواقع از نمونه آماری بهره میبریم. این کار البته باعث میشود که مقداری از اطلاعات که در جامعه آماری وجود دارد، نادیده گرفته شده و برآوردها و تخمینهایی که برای پارامتر جامعه آماری محاسبه میشوند با خطا همراه باشد. به منظور کاهش خطا به میزان مورد نظر و افزایش میزان اعتبار نتایج از تحلیلهای آماری باید تعداد مناسبی نمونه انتخاب شود. از آنجایی که افزایش حجم نمونه باعث افزایش هزینه و زمان تحلیل آماری میشود، باید به حداقل حجم نمونهای که خطایی معقول در برآورد پارامترهای جامعه دارد، قناعت کنیم.
در بررسی یک مسئله با روش های آماری ، باید نقشه آزمایش کشیده شود که شامل روش جمع آوری داده ها،اندازه نمونه مورد نظر و روش حل آن مسئله است. در این مورد هر چه نقشه آزمایش دقیق تر باشد ، نتایج به دست آمده از روش های آماری بهتر خواهند بود . بخصوص ، باید اطمینان حاصل شود که هیچ یک از اندازه گیری هایی که برای نتایج مورد نظر دارای اهمیت اند از قلم نیفتند یا ناقص نباشند...
اما در این مورد همچنین می توان ، تنها به همان اندازه که می شود با بخش ناچیزی از هزینه ها به دست آورد قناعت و از دستاوردی با یک رشته آزمون بسیار پرخرج اجتناب کرد.
نرمافزارها:
با توجه به تنوع روشها و پیچیدگی محاسبات در تحلیلهای آماری، استفاده از نرمافزارهای رایانهای گریز ناپذیر است. از طرفی نرمافزارهای مختلفی برای انجام چنین تحلیلهای توسعه یافتهاند. بنابراین انتخاب نرمافزار مناسب که مطابق با نیازها و احتیاج ما باشد، امری ضروری به نظر میرسد. برخی نرم افزارهای آماری آنقدر گسترش و محبوبیت دارند که برخی افراد آمار را با نام این نرم افزارها می شناسند مانند SPSS.
قابلیت های SPSS به شرح زیر است:
- تهیه خلاصه های آماری مانند گراف ها، جداول ، آماره ها و ...
- انواع توابع ریاضی مانند قدر مطلق، تابع علامت، لگاریتم، توابع مثلثاتی و ...
- تهیه انواع جداول سفارشی مانند جداول فراوانی، فراوانی تجمعی، درصد فراوانی و ...
- انواع توزیع های آماری شامل توزیع های گسسته و پیوسته
- تهیه انواع طرح های آماری
- انجام آنالیز واریانس یکطرفه، دوطرفه، چندطرفه و آنالیز کوواریانس
- تکنیک های تجزیه و تحلیل سری های زمانی
- ایجاد داده های تصادفی و پیوسته
- محاسبه انواع آماره های توصیفی
- انواع آزمون های مرتبط با مقایسه میانگین بین دو یا چند جامعه مستقل و وابسته
- قابلیت مبادله اطلاعات با نرم افزارهای دیگر
- برازش انواع مختلف رگرسیون
زمانی که داده ها از مدل های غیر نرمال با حجم کم و یا تکرار زیاد برخوردار هستند، روش های آماری معمول برای تحلیل داده ها کافی نمی باشد. بدیهی است نرم افزار SPSS هم قادر به انجام تحلیل ها نمی باشد. نرم افزارهای پیشرفته آماری از جمله R ، SAS ، Minitab، Stata از محبوت ترین و کامل ترینآن ها می باشند. از جمله مزایای آن ها می توان به موراد زیر اشاره کرد:
- زبان برنامهنویسی و محیط نرمافزاری برای محاسبات آماری و علم دادهها.
- زبان برنامهنویسی ساده و پیشرفته شامل عبارتهای شرطی ،حلقه و توابع بازگشتی و …
- نرمافزار قدرتمندی با امکانات گرافیکی برای تجزیهوتحلیل دادهها، رسم نمودار و ایجاد اشکال.
- حاوی محدوده گستردهای از تکنیکهای آماری.
- بستههای نرمافزاری قدرتمند برای تجزیهوتحلیل آماری.
- توانایی انجام محاسبات ماتریسی.
- کتابخانههای انجام عملیات دادهکاوی و یادگیری ماشین مانند دستهبندی، خوشهبندی، تحلیل شبکه اجتماعی، یادگیری تقویتی و…
- کتابخانههای خاص برای انجام عملیات تحلیلی در زمینههای مختلف علمی.
- دارای مستندات فرمت بندی شده و منظم برای استفاده از زبان و کتابخانههای مرتبط.
- امکان توسعه قابلیتهای آن ها، با افزودن بستههای ایجادشده توسط کاربران خبره.
- دارای محیط خط فرمان برای ورود و اجرای دستورات.
- امکانات ذخیره ،بازیابی و دستکاری دادهها.
در آزمایشگاه آتیه درخشان ذهن متخصصین آمار آماده ی ارائه ی مشاوره در زمینه ی طراحی طرح آزمایشی و همچنین آنالیز داده های پژوهشگران هستند.