Kendall’s Rank Correlation Test | केंडल रैंक सहसंबंध परीक्षण
Kendall’s Rank Correlation Test | केंडल रैंक सहसंबंध परीक्षण
केंडल रैंक सहसंबंध परीक्षण (Kendall’s Rank Correlation Test)
परिचय
केंडल रैंक सहसंबंध परीक्षण (Kendall’s Rank Correlation Test), जिसे केंडल का τ (टाऊ) भी कहा जाता है, एक महत्वपूर्ण नॉन-पैरामीट्रिक परीक्षण है जो दो चरों (Variables) के बीच संबंध की दिशा और तीव्रता मापता है। यह परीक्षण विशेष रूप से तब उपयोगी होता है जब डेटा केवल रैंक (Rank) के रूप में उपलब्ध हो या जब डेटा सामान्य वितरण (Normal Distribution) का पालन न करता हो।
केंडल का τ एक सहसंबंध गुणांक है जो रैंक की तुलना करके दो चरों के बीच मोनोटोनिक (Monotonic) संबंध को मापता है। यदि दोनों चर एक ही दिशा में बढ़ते या घटते हैं तो संबंध धनात्मक होता है; यदि एक बढ़ता है और दूसरा घटता है तो संबंध ऋणात्मक होता है।
मुख्य विशेषताएँ
- यह रैंक आधारित संबंध का माप है।
- छोटे सैंपलों और असंतुलित डेटा के लिए उपयुक्त।
- आउटलायर्स या चरम मानों से कम प्रभावित।
- मोनोटोनिक लेकिन अनिवार्य रूप से रैखिक नहीं।
परीक्षण का उद्देश्य
- दो चरों के बीच संबंध (Association) की दिशा और ताकत का मापन।
- जब Pearson और Spearman सहसंबंध लागू न हों।
- रैंक आधारित डेटा में पैटर्न या समानता की पहचान।
परिकल्पना का निर्माण
- शून्य परिकल्पना (H₀): दोनों चरों के बीच कोई संबंध नहीं है (τ = 0)।
- वैकल्पिक परिकल्पना (H₁): दोनों चरों के बीच महत्वपूर्ण संबंध मौजूद है (τ ≠ 0)।
केंडल का τ (टाऊ) का सूत्र
केंडल का τ इस प्रकार परिभाषित किया गया है:
τ = (C – D) / [½ n(n–1)]
जहाँ:
- C = सम्मत युग्मों (Concordant Pairs) की संख्या
- D = असम्मत युग्मों (Discordant Pairs) की संख्या
- n = अवलोकनों की संख्या
समझने का तरीका
- Concordant Pair: यदि X और Y दोनों में एक ही दिशा में वृद्धि होती है।
- Discordant Pair: यदि X में वृद्धि होती है लेकिन Y में कमी या इसके विपरीत।
ρ (टाऊ) का व्याख्या
| τ का मान | संबंध का प्रकार |
|---|---|
| +1 | पूर्ण धनात्मक सहसंबंध (Perfect Positive Correlation) |
| 0 | कोई संबंध नहीं (No Correlation) |
| –1 | पूर्ण ऋणात्मक सहसंबंध (Perfect Negative Correlation) |
गणना की प्रक्रिया
- दोनों चरों के अवलोकनों को आरोही क्रम में रैंक करें।
- सभी युग्मों (Pairs) के लिए जांचें कि वे Concordant हैं या Discordant।
- C और D की गणना करें।
- τ निकालें = (C – D) / [½ n(n–1)]
- τ का मान –1 से +1 के बीच रहेगा।
उदाहरण
मान लीजिए पाँच विद्यार्थियों के दो विषयों में अंक इस प्रकार हैं:
| छात्र | गणित (X) | विज्ञान (Y) |
|---|---|---|
| 1 | 80 | 78 |
| 2 | 90 | 88 |
| 3 | 70 | 72 |
| 4 | 85 | 84 |
| 5 | 60 | 65 |
अब सभी युग्मों के लिए Concordant और Discordant Pair गिने जाते हैं:
- कुल युग्म = ½ × 5 × (5–1) = 10
- Concordant (C) = 9
- Discordant (D) = 1
अतः τ = (9 – 1) / 10 = 0.8
इसका अर्थ है कि गणित और विज्ञान के अंकों में मजबूत धनात्मक संबंध है।
महत्व परीक्षण
τ के महत्व को जांचने के लिए Z-सांख्यिकी का उपयोग किया जा सकता है:
Z = τ √[9n(n–1)] / √[2(2n + 5)]
यदि |Z| > Zα/2, तो H₀ अस्वीकार करें।
केंडल τ बनाम स्पीयरमैन ρ
| मापदंड | केंडल τ | स्पीयरमैन ρ |
|---|---|---|
| आधार | Concordant और Discordant Pairs | रैंक अंतर (Rank Difference) |
| संवेदनशीलता | छोटे सैंपल पर स्थिर | बड़े सैंपल पर अधिक सटीक |
| डेटा पर प्रभाव | आउटलायर्स से कम प्रभावित | थोड़ा प्रभावित |
| प्रयोग | छोटे डेटा सेट में | बड़े डेटा सेट में |
डेटा साइंस में उपयोग
- फीचर चयन (Feature Selection) के दौरान रैंक आधारित निर्भरता पहचानने के लिए।
- रैंकिंग एल्गोरिद्म जैसे Recommendation Systems में समानता मापने के लिए।
- Survey डेटा में दो प्रश्नों के उत्तरों के बीच समानता की जांच।
- Machine Learning मॉडल के फीचर्स में ऑर्डिनल पैटर्न पहचान।
- Customer feedback या रेटिंग्स विश्लेषण।
लाभ
- सरल और व्याख्यायोग्य।
- डेटा के वितरण पर निर्भर नहीं।
- Ordinal और Continuous दोनों प्रकार के डेटा पर लागू।
- आउटलायर्स के प्रभाव से मुक्त।
सीमाएँ
- गणना जटिल हो सकती है यदि डेटा में बहुत अधिक टाई हों।
- केवल दो चर के बीच संबंध मापता है।
- Non-monotonic संबंधों के लिए उपयुक्त नहीं।
निष्कर्ष
केंडल रैंक सहसंबंध परीक्षण एक अत्यंत प्रभावी नॉन-पैरामीट्रिक तकनीक है जो दो चरों के बीच संबंध की दिशा और ताकत को मापता है। यह डेटा साइंस में तब उपयोगी होता है जब पारंपरिक Pearson या Spearman विधियाँ उपयुक्त नहीं होतीं। इसका उपयोग मशीन लर्निंग, सर्वे विश्लेषण, मनोविज्ञान, और सामाजिक अनुसंधान में विश्वसनीय सांख्यिकीय निष्कर्ष प्राप्त करने के लिए किया जाता है।
Related Articles
Data Frame in R | R में डेटा फ़्रेम
R में डेटा फ़्रेम (Data Frame in R) परिचय R प्रोग...
Read More →Linear Model in R | R में रैखिक मॉडल
R में रैखिक मॉडल (Linear Model in R) परिचय R प्रोग...
Read More →Working with and Manipulating Data in R | R में डेटा पर कार्य करना और उसे संशोधित करना
R में डेटा पर कार्य करना और उसे संशोधित करना (Wo...
Read More →Writing Data in R | R में डेटा लिखना
R में डेटा लिखना (Writing Data in R) परिचय डेटा व...
Read More →