Care este relația dintre R-Squared și coeficientul de corelație al unui model?

Care este relația dintre R-Squared și coeficientul de corelație al unui model?
Anonim

Răspuns:

Vezi asta. Credit pentru Gaurav Bansal.

Explicaţie:

Încercam să mă gândesc la cel mai bun mod de a explica acest lucru și am dat peste o pagină care face o treabă foarte frumoasă. Aș prefera să-i dau acestui tip creditul pentru explicație. În cazul în care link-ul nu funcționează pentru unii am inclus câteva informații de mai jos.

Pur și simplu a declarat: # R ^ 2 # valoarea este pur și simplu pătratul coeficientului de corelație # R #.

coeficient de corelație (# R #) a unui model (spuneți cu variabilele #X# și # Y #) ia valori între #-1# și #1#. Descrie cum #X# și # Y # sunt corelate.

  • Dacă #X# și # Y # sunt în perfectă unison, atunci această valoare va fi pozitivă #1#
  • Dacă #X# crește în timp # Y # scade exact în modul opus, atunci această valoare va fi #-1#
  • #0# ar fi o situație în care nu există o corelație între #X# și # Y #

Totuși, asta # R # valoarea este utilă doar pentru un model liniar simplu (doar un #X# și # Y #). Odată ce analizăm mai mult de o variabilă independentă (acum avem # # X_1, # # X_2, …), este foarte greu de înțeles ce înseamnă coeficientul de corelație. Urmărirea variabilei care contribuie la corelație nu este atât de clară.

Aici este locul unde # R ^ 2 # valoarea intră în joc. Este pur și simplu pătratul coeficientului de corelație. Este nevoie de valori între #0# și #1#, unde valori apropiate #1# implică mai multă corelație (fie corelată pozitiv, fie negativ) și #0# nu implică corelație. O altă modalitate de a gândi este ca variația fracționată a variabilei dependente este rezultatul tuturor variabilelor independente. Dacă variabila dependentă depinde în mare măsură de toate variabilele sale independente, valoarea va fi aproape de #1#. Asa de # R ^ 2 # este mult mai util, deoarece poate fi folosit și pentru a descrie modele multivariate.

Dacă doriți o discuție cu privire la unele dintre noțiunile matematice implicate în relaționarea celor două valori, consultați acest lucru.