Spearman’s Rank Correlation Test | स्पीयरमैन रैंक सहसंबंध परीक्षण
Spearman’s Rank Correlation Test | स्पीयरमैन रैंक सहसंबंध परीक्षण
स्पीयरमैन रैंक सहसंबंध परीक्षण (Spearman’s Rank Correlation Test)
परिचय
स्पीयरमैन रैंक सहसंबंध परीक्षण (Spearman’s Rank Correlation Test) एक अत्यंत प्रसिद्ध नॉन-पैरामीट्रिक परीक्षण है जिसका उपयोग दो चर (Variables) के बीच संबंध (Correlation) की दिशा और तीव्रता मापने के लिए किया जाता है। यह परीक्षण तब उपयोगी होता है जब डेटा सामान्य वितरण (Normal Distribution) का पालन नहीं करता या जब डेटा केवल क्रमबद्ध (Ordinal) रूप में उपलब्ध हो।
स्पीयरमैन का सहसंबंध गुणांक (Spearman’s Rank Correlation Coefficient), जिसे ρ (rho) द्वारा दर्शाया जाता है, यह मापता है कि दो चर के बीच एकसमान (Monotonic) संबंध है या नहीं। यदि एक चर बढ़ता है और दूसरा भी सामान्यतः बढ़ता है, तो सहसंबंध धनात्मक होता है; यदि एक बढ़ता है और दूसरा घटता है, तो सहसंबंध ऋणात्मक होता है।
मुख्य विशेषताएँ
- यह एक रैंक-आधारित सहसंबंध माप है।
- डेटा के मूल मानों की बजाय रैंकों का उपयोग किया जाता है।
- नॉन-नॉर्मल, असंतुलित, या आउटलायर वाले डेटा के लिए उपयुक्त।
- दोनों चर के बीच एकसमान संबंध का मूल्यांकन करता है।
परीक्षण का उद्देश्य
- दो चरों के बीच संबंध की दिशा और शक्ति का निर्धारण।
- डेटा के मोनोटोनिक पैटर्न (Monotonic Pattern) को पहचानना।
- जब Pearson Correlation की शर्तें पूरी न हों।
परिकल्पना का निर्माण
- शून्य परिकल्पना (H₀): दोनों चरों के बीच कोई संबंध नहीं है (ρ = 0)।
- वैकल्पिक परिकल्पना (H₁): दोनों चरों के बीच महत्वपूर्ण संबंध मौजूद है (ρ ≠ 0)।
सूत्र
Spearman’s Rank Correlation Coefficient का सूत्र है:
ρ = 1 – [ (6 Σd²) / (n (n² – 1)) ]
जहाँ:
- d = दो चरों के रैंकों के बीच का अंतर (Rank Difference)
- n = अवलोकनों की संख्या
गणना की प्रक्रिया
- दोनों चरों के अवलोकनों को आरोही क्रम में रैंक दें।
- प्रत्येक अवलोकन के लिए रैंक का अंतर (d) निकालें।
- d² का मान निकालें और Σd² ज्ञात करें।
- ऊपर दिए गए सूत्र से ρ का मान निकालें।
- ρ के मान को –1 से +1 के बीच व्याख्यायित करें।
ρ की व्याख्या
| ρ का मान | संबंध का प्रकार |
|---|---|
| +1 | पूर्ण धनात्मक सहसंबंध (Perfect Positive Correlation) |
| 0 | कोई सहसंबंध नहीं (No Correlation) |
| –1 | पूर्ण ऋणात्मक सहसंबंध (Perfect Negative Correlation) |
उदाहरण
मान लीजिए किसी अध्ययन में 6 छात्रों के गणित और विज्ञान के अंक इस प्रकार हैं:
| छात्र | गणित (X) | विज्ञान (Y) |
|---|---|---|
| 1 | 90 | 85 |
| 2 | 80 | 78 |
| 3 | 75 | 82 |
| 4 | 70 | 72 |
| 5 | 60 | 65 |
| 6 | 50 | 58 |
अब दोनों के लिए रैंक निर्धारित करें (1 = Highest):
| छात्र | गणित रैंक (Rₓ) | विज्ञान रैंक (Rᵧ) | d = Rₓ – Rᵧ | d² |
|---|---|---|---|---|
| 1 | 1 | 1 | 0 | 0 |
| 2 | 2 | 3 | –1 | 1 |
| 3 | 3 | 2 | 1 | 1 |
| 4 | 4 | 4 | 0 | 0 |
| 5 | 5 | 5 | 0 | 0 |
| 6 | 6 | 6 | 0 | 0 |
Σd² = 2 अतः ρ = 1 – (6×2) / (6×(36–1)) = 1 – 12/210 = 0.943
अर्थात गणित और विज्ञान के अंकों में अत्यंत मजबूत धनात्मक सहसंबंध है।
महत्व परीक्षण (Significance Testing)
H₀: ρ = 0 को परखने के लिए T-सांख्यिकी का उपयोग किया जाता है:
t = ρ√(n–2) / √(1–ρ²)
यह t (n–2) स्वतंत्रता डिग्री के साथ Student’s t-वितरण का पालन करता है।
डेटा साइंस में उपयोग
- मशीन लर्निंग फीचर्स के बीच सहसंबंध पहचानने के लिए।
- रैंकिंग आधारित मॉडल जैसे Recommendation Systems में।
- सेंटिमेंट स्कोर और रेटिंग्स के संबंध का विश्लेषण।
- Survey Data और Ordinal स्केल विश्लेषण में।
- असामान्य (non-linear) संबंधों की पहचान के लिए।
लाभ
- नॉन-नॉर्मल और आउटलायर वाले डेटा पर उपयुक्त।
- सरल गणना और व्याख्या।
- Ordinal और Continuous दोनों डेटा पर लागू।
- Monotonic संबंधों के लिए प्रभावी।
सीमाएँ
- Non-monotonic संबंधों को मापने में सक्षम नहीं।
- टाई रैंकिंग से त्रुटि की संभावना।
- Correlation ≠ Causation — संबंध कारण नहीं दर्शाता।
निष्कर्ष
स्पीयरमैन रैंक सहसंबंध परीक्षण डेटा साइंस में उन परिस्थितियों में अत्यंत उपयोगी है जहाँ Pearson Correlation लागू नहीं होता। यह डेटा के रैंकिंग पैटर्न के आधार पर संबंधों की गहराई को मापता है, जिससे विश्लेषक और शोधकर्ता गैर-रेखीय या असमान डेटा के बीच वास्तविक संबंध पहचान सकते हैं। मशीन लर्निंग, मनोविज्ञान, और सामाजिक अनुसंधान में यह परीक्षण एक विश्वसनीय सांख्यिकीय उपकरण के रूप में व्यापक रूप से प्रयोग होता है।
Related Articles
Data Frame in R | R में डेटा फ़्रेम
R में डेटा फ़्रेम (Data Frame in R) परिचय R प्रोग...
Read More →Linear Model in R | R में रैखिक मॉडल
R में रैखिक मॉडल (Linear Model in R) परिचय R प्रोग...
Read More →Working with and Manipulating Data in R | R में डेटा पर कार्य करना और उसे संशोधित करना
R में डेटा पर कार्य करना और उसे संशोधित करना (Wo...
Read More →Writing Data in R | R में डेटा लिखना
R में डेटा लिखना (Writing Data in R) परिचय डेटा व...
Read More →