Mann–Whitney U Test | मैन–व्हिटनी यू परीक्षण
Mann–Whitney U Test | मैन–व्हिटनी यू परीक्षण
मैन–व्हिटनी यू परीक्षण (Mann–Whitney U Test)
परिचय
मैन–व्हिटनी यू परीक्षण (Mann–Whitney U Test) एक अत्यंत महत्वपूर्ण नॉन-पैरामीट्रिक परीक्षण है जिसका उपयोग दो स्वतंत्र नमूनों (Independent Samples) के बीच अंतर की जांच करने के लिए किया जाता है। यह इंडिपेंडेंट सैंपल्स t-test का नॉन-पैरामीट्रिक विकल्प है, और तब प्रयोग में लाया जाता है जब डेटा सामान्य वितरण (Normal Distribution) का पालन नहीं करता।
इस परीक्षण को Wilcoxon Rank Sum Test भी कहा जाता है क्योंकि यह दोनों समूहों के डेटा को रैंक (Rank) के आधार पर तुलना करता है। यह परीक्षण यह निर्धारित करता है कि क्या दो स्वतंत्र जनसंख्याएँ (Populations) समान वितरण से आती हैं या एक दूसरे से भिन्न हैं।
परीक्षण का उद्देश्य
- यह जाँचना कि क्या दो स्वतंत्र समूहों की माध्यक या वितरण समान हैं।
- जब डेटा सामान्य नहीं है या स्केल केवल रैंक-आधारित है।
- जब सैंपल साइज असमान हो।
परिकल्पना का निर्माण
- शून्य परिकल्पना (H₀): दोनों समूहों का वितरण समान है।
- वैकल्पिक परिकल्पना (H₁): दोनों समूहों के वितरण में महत्वपूर्ण अंतर है।
मैन–व्हिटनी यू परीक्षण की प्रक्रिया
- दो स्वतंत्र नमूने A और B लें, जिनके आकार क्रमशः n₁ और n₂ हैं।
- दोनों नमूनों को मिलाकर उन्हें आरोही क्रम में व्यवस्थित करें।
- प्रत्येक मान को रैंक प्रदान करें (सबसे छोटे को रैंक 1)।
- प्रत्येक समूह के लिए रैंकों का योग निकालें:
- U सांख्यिकी निम्न सूत्र से निकालें:
- U = छोटे मान का चयन करें (U = min(U₁, U₂))।
- तालिका या नॉर्मल एप्रॉक्सिमेशन से critical value की तुलना करें।
R₁ = समूह 1 के रैंक का योग
R₂ = समूह 2 के रैंक का योग
U₁ = n₁n₂ + (n₁(n₁+1))/2 – R₁
U₂ = n₁n₂ + (n₂(n₂+1))/2 – R₂
उदाहरण
मान लीजिए कि दो समूहों के छात्रों ने अलग-अलग शिक्षण विधियों से अध्ययन किया:
समूह A: 85, 78, 90, 88, 76
समूह B: 70, 82, 65, 80, 75
दोनों समूहों के सभी स्कोर को मिलाकर आरोही क्रम में व्यवस्थित करें:
65, 70, 75, 76, 78, 80, 82, 85, 88, 90
रैंक आवंटन:
- समूह A = (4, 5, 8, 9, 10)
- समूह B = (1, 2, 3, 6, 7)
अब:
- R₁ = 4 + 5 + 8 + 9 + 10 = 36
- R₂ = 1 + 2 + 3 + 6 + 7 = 19
U₁ = 5×5 + 5×6/2 – 36 = 25 + 15 – 36 = 4
U₂ = 5×5 + 5×6/2 – 19 = 25 + 15 – 19 = 21
U = 4 (छोटा मान)
α = 0.05 और n₁ = n₂ = 5 के लिए, critical value = 2 चूंकि 4 > 2, इसलिए H₀ अस्वीकार नहीं किया जाता। अर्थात शिक्षण विधियों के बीच कोई महत्वपूर्ण अंतर नहीं है।
नॉर्मल एप्रॉक्सिमेशन
यदि सैंपल साइज बड़ा है (n₁, n₂ ≥ 20), तो Normal approximation का उपयोग किया जाता है:
Z = (U – μU) / σU
जहाँ:
μU = (n₁n₂) / 2
σU = √[n₁n₂(n₁ + n₂ + 1) / 12]
मैन–व्हिटनी यू परीक्षण के लाभ
- सामान्य वितरण की आवश्यकता नहीं।
- Ordinal या रैंक आधारित डेटा पर लागू।
- आउटलायर्स से कम प्रभावित।
- छोटे सैंपल के लिए भी उपयुक्त।
सीमाएँ
- केवल दो स्वतंत्र समूहों की तुलना के लिए उपयुक्त।
- समान आकार और आकृति वाले वितरणों की मान्यता।
- टाई रैंकों के मामलों में जटिल गणना।
डेटा साइंस में उपयोग
- मॉडल A और मॉडल B के प्रदर्शन मापों की तुलना।
- दो ग्राहक समूहों की संतुष्टि स्कोर तुलना।
- मशीन लर्निंग मॉडल की त्रुटि दरों का विश्लेषण।
- क्लिनिकल रिसर्च में दो उपचारों की तुलना।
निष्कर्ष
मैन–व्हिटनी यू परीक्षण नॉन-पैरामीट्रिक परीक्षणों में सबसे अधिक प्रयुक्त विधियों में से एक है। यह उन परिस्थितियों में अत्यंत उपयोगी है जहाँ डेटा सामान्य वितरण का पालन नहीं करता या स्केल मात्र रैंकिंग के रूप में उपलब्ध होता है। डेटा साइंस, रिसर्च और मशीन लर्निंग मॉडल मूल्यांकन में यह परीक्षण सांख्यिकीय निर्णय लेने का एक विश्वसनीय और लचीला तरीका प्रदान करता है।
Related Articles
Data Frame in R | R में डेटा फ़्रेम
R में डेटा फ़्रेम (Data Frame in R) परिचय R प्रोग...
Read More →Linear Model in R | R में रैखिक मॉडल
R में रैखिक मॉडल (Linear Model in R) परिचय R प्रोग...
Read More →Working with and Manipulating Data in R | R में डेटा पर कार्य करना और उसे संशोधित करना
R में डेटा पर कार्य करना और उसे संशोधित करना (Wo...
Read More →Writing Data in R | R में डेटा लिखना
R में डेटा लिखना (Writing Data in R) परिचय डेटा व...
Read More →