پایگاه جامع اطلاعات مکانی ایران
پایگاه جامع اطلاعات مکانی ایران تارنما دانش - محتوای کاربردی بررسی نرمال بودن داده‌ها

بررسی نرمال بودن داده‌ها

بررسی نرمال بودن داده‌ها

1401/12/29
در این فیلم آموزشی، با نحوه بررسی روش‌های نرمال بودن توزیع داده‌ها در زبان برنامه‌نویسی R آشنا خواهید شد.


روش‌های بررسی نرمال بودن توزیع داده‌ها

یکی از توزیع‌های مهم آماری و شاید بتوان گفت مهم‌ترین آن‌ها، توزیع نرمال است. توزیع نرمال به دلیل داشتن ویژگی‌هایی مثل تقارن و همچنین ارتباط آن با قضیه حد مرکزی، از توجه ویژه‎ای برخوردار است. همچنین، نرمال بودن توزیع داده‎‌ها، به عنوان پیش‌فرض بسیاری از روش‌های آماری از جمله آزمون مقایسه میانگین جوامع (آزمون تی استیودنت)، آزمون تحلیل واریانس، آزمون همگنی واریانس جوامع (آزمون فیشر)، آزمون همبستگی پیرسون و ... محسوب می‌شود و در صورت عدم برقراری فرض نرمالیتی، مجاز به استفاده از این روش‌ها نیستیم. به عبارت دیگر، در صورت نرمال نبودن توزیع داده‌ها، نتایج به دست آمده از این روش‌ها، قابل استناد نیست. لذا، قبل از انجام این روش‌ها، باید فرض نرمال بودن توزیع داده‌ها بررسی و از نرمال بودن داده‌ها اطمینان حاصل شود. به منظور بررسی فرض نرمال بودن توزیع داده‌ها، روش‌های مختلفی وجود دارد که به دو دسته کلی تقسیم می‌شوند. این دو دسته عبارتند از روش‌های توصیفی که شامل رسم نمودارهای مختلف است و روش‌های استنباطی که به وسیله آزمون‌های آماری مختلف انجام می‌شوند.

در روش‌ توصیفی، ابتدا می‌توان نمودار هیستوگرام داده‌ها را رسم کرد و آن را با منحنی چگالی توزیع نرمال مقایسه کرد. همچنین می‌توان نمودار چندک - چندک داده‌ها را نیز رسم کرد. در نمودار چندک-چندک (Q-Q Plot)، چندک‌های یک توزیع احتمال خاص (که در اینجا توزیع نرمال است) در برابر چندک‌های نمونه‌ای داده‌ها رسم می‌شوند. هر چه مقادیر چندک‌ها در نمودار پراکنش رسم شده، در راستای یک خط مستقیم قرار بگیرند؛ توزیع داده‌ها به توزیع مورد نظر نزدیکتر خواهد بود. همچنین در ادامه، نحوه انجام آزمون‌های آماری شاپیرو-ویلک (Shapiro-Wilk) و کلموگروف-اسمیرنف (Kolmogorov-Smirnov) در نرم‎‌افزار R را مورد بررسی قرار می‌دهیم که از جمله روش‌های استنباطی بررسی فرض نرمال بودن داده‌ها هستند. با استفاده از این دو آزمون آماری، می‌توان فرض نرمال بودن توزیع داده‌ها را به طور دقیق‌تر مورد ارزیابی قرار داد. در این قسمت از مجموعه آموزشی، به بررسی روش‌های نرمال بودن توزیع یک مجموعه داده در نرم‎‌افزار R، می‌پردازیم.

ارسال نظر:


پایگاه جامع اطلاعات مکانی ایران
پایگاه داده مکانی Spatial Database Mobile GIS برنامه نویسی GIS UMD Tile Map Base Map نقشه پایه تصویر گوگل OpenStreatMap ggplot2 theme element line text rect R Markdown RStudio Knit HTML PDF گزارش Shiny ui server Web Application Coordinate Scale Label سفارشی سازی facet geom مصورسازی نمودار visualization separate() extract() unit() Data Cleaning tidyr gather() spread() tidy data داده مرتب pivot_longer() pivot_wider() ادغام join inner join full join left join right join merge() ادغام داخلی ادغام کامل ادغام از چپ ادغام از راست summarise() group_by() گروه‌بندی تجمیع pipe pipe operator عملگر پایپ magrittr پایپ Assignment pipe Exposition pipe Tee pipe dplyr preprocessing select() mutate() rename() relocate() filter() arrange() slice() تبدیل داده‌ها آماده‌سازی پیش‌پردازش ANOVA Analysis of variance One way ANOVA T Test One Sample T Test Two Samples Paired Samples Normalization Min Max Standardization Z Score Box Cox سالیدورک solidworks نرم افزار سالیدورک متاسالید SolidWorks R R Studio Shapiro Wilk Kolmogorov Smirnov Q Q Plot ArcGIS plot distribution density quantile set.seed() ArcGIS Pro Tools Join Excel Slope Erase Hillshade ابزار سایه روشن 3D customization color legend() point Union Buffer DEM مدل رقومی ارتفاعی axis label par() mfrow mfcol layout() سیستم مختصات سیستم تصویر Projection Digitizing رقومی سازی پایگاه داده Geodatabase Symbology رنگ بندی دسته بندی Insert تب روبان افزونه Map Project معرفی نرم افزار ESRI نصب Pie Plot Qualitative نمودار دایره‌ای Box Plot group descriptive نمودار جعبه‌ای Bar Plot نمودار میله‌ای discrete Histogram Scatter Plot Descriptive Central Variability Frequency EStudio Error Warning Debugging Import Export read write apply lapply sapply tapply mapply package load install.packages CRAN ArcGIS Server WebGIS JavaScript API function arguments input output next break control for while loop if ifelse() condition dataset str summary Missing Values NA NaN Factor levels gropping Factor Variable Logical Logical Operator Relational Operator convert Data Structure variables Operations Mathematical Relational ENVI 4.6.1 آموزش نرم افزار python پایتون آموزش Data Frame Array List Vector Matrix variable numeric integer logical character Base MAP OSM Google map Multi Ring Layout View Rstudio programming help workspace directory working directory install Programming نصب نرم‌افزار R Aspect IDW Kriging Reclassify Sum Weighted Split By Attribute Raster Calculator درونیابی افزایش سرعت Mosaic Arcgis Index Fishnet Clip QGIS ArcGIS PRO Pivot Table Add Field Feature To Line Point Append Dissolve Point Distance Proximity Near Generate Near Table بافر حریم Symmetrical Difference Spatial join arcgis tools intersect ShapeFile gis identity arcgis pro اسکریپت نویسی Tool ابزار Erase ابزار Split Select ابزار table select Area DATA Setup raster SHP Convert رستر وکتور clip data shp GPX GPS شیپ فایل جی پی اس KML Json Data shapefile Autocad Shapefile symbology سیمبولوژی Query Edit Add Data excel لیبل زدن برچسب گذاری coordinate ARCGIS Shape file آموزش نرم افزار arcgis افزودن داده نصب و راه اندازی Global Mapper ابزارهای کاربردی سیستم اطلاعات مکانی ابزار مکانی محاسبه مساحت

©BRB تمامی حقوق طراحی سایت متعلق به شرکت دانش‌بنیان بهین ره‌آورد بهبود می باشد.