آزمون همبستگی

ساخت وبلاگ

این تابع یک آزمون همبستگی بین دو متغیر انجام می دهد. شما به راحتی می توانید نتیجه را با استفاده از plot() تجسم کنید (نمونه ها را اینجا ببینید).

استفاده

cor_test( داده ها, x, y, روش= "پیرسون", ci= 0. 95, بیزی= نادرست, bayesian_prior= "متوسط", bayesian_ci_method= "hdi", bayesian_test= c("پی دی", "طناب", "bf"), شامل_فاکتورها= نادرست, جزئي= نادرست, جزئی_بیزی= نادرست, چند سطحی= نادرست, تبدیل رتبه= نادرست, winsorize= نادرست, پر حرف= درست است، واقعی, .  )

استدلال ها

داده ها

نام دو متغیر موجود در داده ها.

یک رشته کاراکتری که نشان می دهد از کدام ضریب همبستگی برای آزمون استفاده می شود. یکی از «پیرسون» (پیش فرض)، «کندال»، «نیه دار» (اما استدلال قوی را نیز ببینید)، «دوباره»، «پلی کوریک»، «تتراکوریک»، «دو وزن»، «فاصله»، «درصد» (برایدرصد همبستگی خمشی)، "blomqvist" (برای ضریب Blomqvist)، "hoeffding" (برای Hoeffding's D)، "گاما"، "gaussian" (برای همبستگی رتبه Gaussian) یا "Shepherd" (برای همبستگی Shepheding Pi). تنظیم "خودکار" در انتخاب مناسب ترین روش تلاش می کند (چند کوریک زمانی که عوامل ترتیبی دخیل هستند، تتراکوریک زمانی که عوامل دوگانه دخیل هستند، نقطه-دوسری اگر یک دوگانه و یک پیوسته و در غیر این صورت پیرسون). برای توضیح این شاخص ها به بخش جزئیات زیر مراجعه کنید.

سطح اعتماد / فاصله زمانی معتبراگر "پیش فرض" باشد، روی 0. 95 (95% CI) تنظیم می شود.

اگر درست باشد، همبستگی ها را تحت چارچوب بیزی اجرا می کند.

برای آرگومان قبلی، چندین مقدار نام گذاری شده شناسایی می شوند: "medium. narrow"، "medium"، "wide" و "ultrawide". اینها به ترتیب با مقادیر مقیاس 1/sqrt(27)، 1/3، 1/sqrt(3) و 1 مطابقت دارند. تابع BayesFactor::correlationBF را ببینید.

آرگومان های مدل_parameters() را برای تست های BayesFactor ببینید.

اگر TRUE باشد، فاکتورها نگه داشته می شوند و در نهایت به عددی تبدیل می شوند یا به عنوان اثرات تصادفی (بسته به چند سطح) استفاده می شوند. اگر FALSE باشد، عوامل از قبل حذف می شوند.

می تواند برای همبستگی های جزئی و نیمه جزئی به ترتیب TRUE یا "نیمه" باشد.

اگر همبستگی های جزئی تحت چارچوب بیزی مورد نیاز است، همچنین باید partial_bayesian را روی TRUE تنظیم کنید تا همبستگی های جزئی بیزی "کامل" را بدست آورید. در غیر این صورت، همبستگی های جزئی شبه بیزی (به عنوان مثال، همبستگی بیزی بر اساس جزئی سازی مکرر) بدست خواهید آورد.

اگر درست باشد، عوامل به عنوان عوامل تصادفی در نظر گرفته می شوند. در غیر این صورت، اگر FALSE (پیش فرض)، آنها به عنوان اثرات ثابت در مدل رگرسیون ساده گنجانده می شوند.

اگر TRUE باشد، متغیرها را قبل از تخمین همبستگی رتبه بندی می کند، که یکی از راه های مقاوم تر کردن تحلیل در برابر مقادیر شدید (فروت ها) است. توجه داشته باشید که، برای مثال، همبستگی پیرسون در داده های تبدیل شده با رتبه، معادل همبستگی رتبه اسپیرمن است. بنابراین، استفاده از robust=TRUE و method="spearman" اضافی است. با این وجود، این یک گزینه آسان برای افزایش استحکام همبستگی و همچنین روشی انعطاف پذیر برای به دست آوردن همبستگی های رتبه بیزی یا چند سطحی اسپیرمن است.

راه دیگری برای قوی تر کردن همبستگی (یعنی محدود کردن تأثیر مقادیر شدید). می تواند FALSE یا عددی بین 0 و 1 (مثلاً 0. 2) باشد که با آستانه مورد نظر مطابقت دارد. برای جزئیات بیشتر تابع winsorize() را ببینید.

آرگومان های اضافی (به عنوان مثال، جایگزین ) برای انتقال به روش های دیگر. برای جزئیات بیشتر به آمار::cor. test مراجعه کنید.

جزئیات

انواع همبستگی

  • همبستگی پیرسون: این رایج ترین روش همبستگی است. این مربوط به کوواریانس دو متغیر نرمال شده (یعنی تقسیم شده) با حاصلضرب انحراف معیار آنها است.
  • همبستگی رتبه اسپیرمن: معیاری ناپارامتریک از همبستگی رتبه ای (وابستگی آماری بین رتبه بندی دو متغیر). همبستگی اسپیرمن بین دو متغیر برابر با همبستگی پیرسون بین مقادیر رتبه آن دو متغیر است. در حالی که همبستگی پیرسون روابط خطی را ارزیابی می کند، همبستگی اسپیرمن روابط یکنواخت (خطی یا غیر خطی) را ارزیابی می کند. فواصل اطمینان (CI) برای همبستگی های اسپیرمن با استفاده از فیلر و همکاران محاسبه می شود. تصحیح (1957) (نگاه کنید به بیشارا و هیتنر، 2017).
  • همبستگی رتبه کندال: در حالت عادی، همبستگی کندال به دلیل حساسیت خطای ناخالص کوچکتر (GES) و واریانس مجانبی کوچکتر (AV) نسبت به همبستگی اسپیرمن ارجحیت دارد. با این حال، تفسیر تائو کندال نسبت به rho اسپیرمن کمتر مستقیم است، به این معنا که تفاوت بین درصد جفت های همخوان و ناسازگار را در میان همه رویدادهای زوجی ممکن نشان می دهد. فواصل اطمینان (CI) برای همبستگی های کندال با استفاده از فیلر و همکاران محاسبه می شود. تصحیح (1957) (نگاه کنید به بیشارا و هیتنر، 2017).
  • میانی با وزن متوسط: اندازه گیری شباهت که مبتنی بر میانه است ، به جای میانگین سنتی مبتنی بر ، بنابراین نسبت به Outliers حساسیت کمتری دارد. این می تواند به عنوان یک جایگزین قوی برای سایر معیارهای شباهت مانند همبستگی پیرسون استفاده شود (Langfelder & Horvath ، 2012).
  • همبستگی فاصله: همبستگی فاصله هم ارتباط خطی و هم غیر خطی بین دو متغیر تصادفی یا بردارهای تصادفی را اندازه گیری می کند. این برخلاف همبستگی پیرسون است ، که فقط می تواند ارتباط خطی بین دو متغیر تصادفی را تشخیص دهد.
  • همبستگی خمشی درصد: معرفی شده توسط Wilcox (1994) ، بر اساس وزن کمتری از درصد مشخصی از مشاهدات حاشیه ای که از میانه منحرف می شوند (به طور پیش فرض ، 20 ٪) است.
  • همبستگی PI Shepherd: معادل همبستگی رتبه Spearman پس از برداشتن Outliers (با استفاده از فاصله Mahalanobis Bootstrapped).
  • ضریب Blomqvist: ضریب Blomqvist (همچنین به عنوان بتا یا همبستگی داخلی Blomqvist یاد می شود ؛ Blomqvist ، 1950) یک همبستگی غیر پارامتری مبتنی بر متوسط است که مزایایی نسبت به اقدامات مانند Spearman یا Kendall دارد (به SHMID & Schimdt ، 2006) مراجعه کنید)بشر
  • Hoeffding's D: آمار D Hoeffding یک اندازه گیری مبتنی بر رتبه غیر پارامتری است که عزیمت عمومی تر از استقلال را تشخیص می دهد (Hoeffding 1948) ، از جمله انجمن های غیرخطی. D Hoeffding بی ن-0. 5 و 1 متفاوت است (در صورت عدم وجود رتبه گره خورده ، در غیر این صورت می تواند مقادیر کمتری داشته باشد) ، با مقادیر بزرگتر نشان دهنده رابطه قوی تر بین متغیرها است.
  • سامرز D: آمار D سامرز یک اندازه گیری مبتنی بر رتبه غیر پارامتری از ارتباط بین یک متغیر باینری و یک متغیر مداوم است ، به عنوان مثال ، در زمینه رگرسیون لجستیک نتیجه باینری و احتمالات پیش بینی شده برای هر نتیجه. معمولاً ، D سامرز اندازه گیری ارتباط نظم است ، با این حال ، این اجرای محدود به مورد نتیجه باینری است.
  • همبستگی نقطه و دوتایی: ضریب همبستگی که در هنگام پیوستگی یک متغیر و دیگری دوگانگی (باینری) استفاده می شود. نقطه-دوراء معادل همبستگی پیرسون است ، در حالی که وقتی فرض می شود که متغیر باینری دارای یک استمرار اساسی باشد ، باید از دوقطبی استفاده شود. به عنوان مثال ، سطح اضطراب را می توان در مقیاس مداوم اندازه گیری کرد ، اما می توان به طور دوگانگی به عنوان بالا/پایین طبقه بندی شد.
  • همبستگی گاما: آمار گاما گودمن-کروسکال شبیه به ضریب تاو کندال است. برای Outliers نسبتاً قوی است و با داده هایی که پیوندهای زیادی دارند خوب است.
  • همبستگی Winsorized: همبستگی متغیرهایی که قبلاً در حال پیروزی بوده اند ، یعنی با محدود کردن مقادیر شدید برای کاهش تأثیر خارج از کشور احتمالاً تبدیل شده اند.
  • همبستگی رتبه گاوسی: برآوردگر همبستگی رتبه گاوسی یک جایگزین ساده و خوب برای همبستگی های رتبه قوی است (Boudt et al. ، 2012). این مبتنی بر مقادیر گاوسی صفوف است.
  • همبستگی پلی چوریک: همبستگی بین دو نظریه پردازی که به طور عادی توزیع می شوند ، از دو متغیر نظم مشاهده شده.
  • همبستگی تتراکوری: مورد ویژه همبستگی پلی چوریک قابل استفاده در هنگام هر دو متغیر مشاهده شده دوگانگی است.

همبستگی جزئی

همبستگی های جزئی به عنوان همبستگی بین دو متغیر پس از تنظیم اثر (خطی) یک یا چند متغیر دیگر تخمین زده می شود. سپس آزمون همبستگی پس از داشتن جزئی در مجموعه داده ، به طور مستقل از آن اجرا می شود. به عبارت دیگر ، جزئی سازی را به عنوان یک مرحله مستقل در نظر می گیرد که یک مجموعه داده متفاوت ایجاد می کند ، نه اینکه به همان مدل تعلق داشته باشد. به همین دلیل است که برخی از اختلافات برای مقادیر T- و P ، CIS ، BFS و غیره (اما نه ضریب همبستگی) در مقایسه با سایر پیاده سازی ها (به عنوان مثال ، PPCOR) انتظار می رود.(اندازه این اختلافات بستگی به تعداد متغیرهای متغیرهای جزئی و قدرت ارتباط خطی بین همه متغیرها دارد.) چنین همبستگی های جزئی را می توان به عنوان مدلهای گرافیکی گاوسی (GGM) ، ابزاری فزاینده محبوب در روانشناسی نشان داد. GGM به طور سنتی شامل مجموعه ای از متغیرهای به تصویر کشیده شده به عنوان دایره ("گره") و مجموعه ای از خطوط است که روابط بین آنها را تجسم می کند ، که ضخامت آن نشان دهنده قدرت ارتباط است (نگاه کنید به Bhushan و همکاران ، 2019).

همبستگی های چند سطحی یک مورد خاص از همبستگی های جزئی است که متغیر برای تنظیم آن یک عامل است و به عنوان یک اثر تصادفی در یک مدل مختلط گنجانده شده است (توجه داشته باشید که متغیرهای مداوم باقی مانده از مجموعه داده ها همچنان به عنوان جلوه های ثابت گنجانده می شوند ، به طور مشابه به طور مشابههمبستگی های جزئی منظم). این مدل یک مدل رهگیری تصادفی است ، یعنی همبستگی چند سطحی برای (1 | GroupFactor) تنظیم می شود. این گفت ، بین استفاده از Cor_Test () و همبستگی () تفاوت مهمی وجود دارد: اگر شما چند برابر را در همبستگی () تنظیم کنید اما درست است. جزئی روی کاذب (طبق پیش فرض) تنظیم شده است ، سپس یک تغییر پشتی از همبستگی جزئی تا غیر حزبی (از طریق PCOR_TO_COR ()) انجام می شود. با این حال ، این کار هنگام استفاده از cor_test () امکان پذیر نیست به طوری که اگر در آن multilevel = true را تنظیم کنید ، همبستگی های حاصل جزئی هستند. توجه داشته باشید که برای همبستگی های چند سطحی بیزی ، اگر جزئی = نادرست باشد ، تحول پشتی نیز بر اساس نمرات جدید R ، مقادیر p را دوباره جبران می کند و عوامل بیز را کاهش می دهد (زیرا آنها دیگر مربوط نیستند). برای حفظ نمرات بیزی ، جزئی = درست است.

یادداشت

همبستگی کندال و اسپیرمن هنگامی که Bayesian = True: اینها از نظر فنی همبستگی های بیزیایی پیرسون از داده های تبدیل شده به جای همبستگی های رتبه بیزی خالص (که دارای مقدمات مختلفی هستند) هستند.

مثال ها

کتابخانه(همبستگی) cor_test(عنبیه, "sepal. l طول", "sepal. width") #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> ------------------------------------------------------------------- #>sepal. l طول |sepal. width |-0. 12 |[-0. 27 ، 0. 04] |-1. 44 |0. 152 #>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "Spearman") #>پارامتر 1 |پارامتر 2 |Rho |95 ٪ CI |S |پ #> ----------------------------------------------------------------------- #>sepal. l طول |sepal. width |-0. 17 |[-0. 32 ، 0. 00] |6. 56e+05 |0. 041* #>  #>مشاهدات: 150 #  dontrun cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "کندال") #>پارامتر 1 |پارامتر 2 |تاو |95 ٪ CI |z |پ #> ------------------------------------------------------------------ #>sepal. l طول |sepal. width |-0. 08 |[-0. 18 ، 0. 03] |-1. 33 |0. 183 #>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "دو وزن") #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> ------------------------------------------------------------------- #>sepal. l طول |sepal. width |-0. 13 |[-0. 29 ، 0. 03] |-1. 65 |0. 100 #>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "فاصله") #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (11024) |پ #> ------------------------------------------------------------------------ #>sepal. l طول |sepal. width |0. 08 |[-0. 08 ، 0. 24] |8. 43 |<.001***#>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "درصد") #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> --------------------------------------------------------------------- #>Sepal. Length |Sepal. Width |-0. 19 |[-0. 34، -0. 03] |-2. 40 |0. 018* #>  #>مشاهدات: 150 if (نیاز("wdm"، بی سر و صدا= درست است، واقعی))   cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "بلومکویست") > #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> ---------------------------------------------------------------------- #>سپال. طول |Sepal. Width |-0. 23 |[-0. 37، -0. 07] |-2. 83 |0. 005** #>  #>مشاهدات: 150 if (نیاز("Hmisc"، بی سر و صدا= درست است، واقعی))   cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "هفدینگ") > #>  #>بسته پیوست: "Hmisc" #>اشیاء زیر از «package:base» پوشانده شده اند: #>  #>format. pval، واحدها #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> ------------------------------------------------------------ #>Sepal. Length |Sepal. Width |0. 01 |||0. 011* #>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "گاما") #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> ------------------------------------------------------------------- #>سپال. طول |Sepal. Width |-0. 08 |[-0. 24، 0. 08] |-0. 99 |0. 323 #>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "گاوسی") #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> ------------------------------------------------------------------- #>سپال. طول |Sepal. Width |-0. 10 |[-0. 26، 0. 06] |-1. 21 |0. 229 #>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "شبان") #>پارامتر 1 |پارامتر 2 |Rho |95 ٪ CI |S |پ #> ------------------------------------------------------------------------ #>سپال. طول |Sepal. Width |-0. 23 |[-0. 39، -0. 07] |6. 02e+05 |0. 005** #>  #>مشاهدات: 150 if (نیاز("BayesFactor"، بی سر و صدا= درست است، واقعی))   cor_test(عنبیه, "sepal. l طول", "sepal. width"، بیزی= درست است، واقعی) > #> ************ #>به BayesFactor 0. 9. 12-4. 4 خوش آمدید. اگر سؤالی دارید، لطفاً با ریچارد موری (richarddmorey@gmail. com) تماس بگیرید. #>  #>برای باز کردن دفترچه راهنمای ()BFManual را تایپ کنید. #> ************ #>پارامتر1 |پارامتر2 |rho |95% CI |پی دی |% در طناب |قبل |BF #> ----------------------------------------------------------------------------------------------- #>سپال. طول |Sepal. Width |-0. 11 |[-0. 27، 0. 04] |91. 90% |42. 70 درصد |بتا (3 +- 3) |0. 509 #>  #>مشاهدات: 150 # قوی (این دو معادل هستند) cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "Spearman") #>پارامتر 1 |پارامتر 2 |Rho |95 ٪ CI |S |پ #> ----------------------------------------------------------------------- #>sepal. l طول |sepal. width |-0. 17 |[-0. 32 ، 0. 00] |6. 56e+05 |0. 041* #>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، روش= "پیرسون"، تبدیل رتبه= درست است، واقعی) #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> --------------------------------------------------------------------- #>سپال. طول |Sepal. Width |-0. 17 |[-0. 32، -0. 01] |-2. 06 |0. 041* #>  #>مشاهدات: 150 # Winsorized cor_test(عنبیه, "sepal. l طول", "sepal. width"، winsorize= 0.2) #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> ---------------------------------------------------------------------- #>سپال. طول |Sepal. Width |-0. 25 |[-0. 39، -0. 09] |-3. 14 |0. 002** #>  #>مشاهدات: 150 # تتراکوریک if (نیاز("روان"، بی سر و صدا= درست است، واقعی) && نیاز("رستانارم"، بی سر و صدا= درست است، واقعی))   داده ها  عنبیه  داده ها$Sepal. Width_binary  اگر دیگری(داده ها$کاسبرگ. عرض > 3, 1, 0)  داده ها$petal. width_binary  اگر دیگری(داده ها$گلبرگ. عرض > 1.2, 1, 0)  cor_test(داده ها, "sepal. width_binary", "petal. width_binary"، روش= "tetrachoric")  # دوتایی  cor_test(داده ها, "sepal. width", "petal. width_binary"، روش= "biserial")  # چندکوریک  داده ها$petal. width_ordinal  عاملی(گرد(داده ها$گلبرگ. عرض))  داده ها$sepal. l طول_ردین  عاملی(گرد(داده ها$sepal. l طول))  cor_test(داده ها, "petal. width_ordinal", "sepal. legth_ordinal"، روش= "پلیچوری")  # هنگامی که یک متغیر مداوم است ، همبستگی "Polyserial" را اجرا می کند  cor_test(داده ها, "sepal. width", "sepal. legth_ordinal"، روش= "پلیچوری") > #>  #>پیوست بسته: "روان" #>شی زیر از "بسته: HMISC" پوشانده شده است: #>  #>توصیف کردن #>اشیاء زیر از "بسته: ggplot2" پوشانده شده اند: #>  #>٪+٪ ، آلفا #>این نسخه rstanarm 2. 21. 3 است #>- برای تغییر در مقدمات پیش فرض ، به https://mc-stan. org/rstanarm/articles/priors مراجعه کنید! #>- مقدمات پیش فرض ممکن است تغییر کند ، بنابراین امنیت برای مشخص کردن مقدمات ، حتی اگر معادل پیش فرض باشد ، امن ترین است. #>- برای اعدام در یک پردازنده محلی و چند هسته ای با RAM اضافی توصیه می کنیم تماس بگیرید #>گزینه ها (mc. cores = موازی :: DetectCores ()) #>  #>بسته بندی پیوست: "rstanarm" #>شی زیر از "بسته: روان" پوشانده شده است: #>  #>لوجیت #> هشدار:موارد دارای تعداد مساوی از گزینه های پاسخ نیستند ، که جهانی به کاذب است. #> هشدار:1 سلول برای 0 مقادیر با استفاده از تصحیح برای تداوم تنظیم شد. داده های خود را با دقت بررسی کنید. #>پارامتر 1 |پارامتر 2 |Rho |95 ٪ CI |T (148) |پ #> --------------------------------------------------------------------------- #>sepal. width |sepal. legth_ordinal |-0. 14 |[-0. 30 ، 0. 02] |-1. 77 |0. 079 #>  #>مشاهدات: 150 # جزئي cor_test(عنبیه, "sepal. l طول", "sepal. width"، جزئي= درست است، واقعی) #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> --------------------------------------------------------------------- #>sepal. l طول |sepal. width |0. 43 |[0. 29 ، 0. 55] |5. 84 |<.001***#>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، چند سطحی= درست است، واقعی) #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> --------------------------------------------------------------------- #>sepal. l طول |sepal. width |0. 43 |[0. 29 ، 0. 55] |5. 85 |<.001***#>  #>مشاهدات: 150 cor_test(عنبیه, "sepal. l طول", "sepal. width"، جزئی_بیزیایی= درست است، واقعی) #>پارامتر 1 |پارامتر 2 |r |95 ٪ CI |T (148) |پ #> --------------------------------------------------------------------- #>sepal. l طول |sepal. width |0. 43 |[0. 29 ، 0. 55] |5. 84 |<.001***#>  #>مشاهدات: 150 #> 

سایت ساخته شده با PKGDown 2. 0. 7. 9000.

مدرسه فارکس معامله گر ایرانی...
ما را در سایت مدرسه فارکس معامله گر ایرانی دنبال می کنید

برچسب : نویسنده : صالح پور مهروز بازدید : 28 تاريخ : پنجشنبه 19 مرداد 1402 ساعت: 23:01