Mann–Whitney U Test | मैन–व्हिटनी यू परीक्षण

Mann–Whitney U Test | मैन–व्हिटनी यू परीक्षण


मैन–व्हिटनी यू परीक्षण (Mann–Whitney U Test)

परिचय

मैन–व्हिटनी यू परीक्षण (Mann–Whitney U Test) एक अत्यंत महत्वपूर्ण नॉन-पैरामीट्रिक परीक्षण है जिसका उपयोग दो स्वतंत्र नमूनों (Independent Samples) के बीच अंतर की जांच करने के लिए किया जाता है। यह इंडिपेंडेंट सैंपल्स t-test का नॉन-पैरामीट्रिक विकल्प है, और तब प्रयोग में लाया जाता है जब डेटा सामान्य वितरण (Normal Distribution) का पालन नहीं करता।

इस परीक्षण को Wilcoxon Rank Sum Test भी कहा जाता है क्योंकि यह दोनों समूहों के डेटा को रैंक (Rank) के आधार पर तुलना करता है। यह परीक्षण यह निर्धारित करता है कि क्या दो स्वतंत्र जनसंख्याएँ (Populations) समान वितरण से आती हैं या एक दूसरे से भिन्न हैं।

परीक्षण का उद्देश्य

  • यह जाँचना कि क्या दो स्वतंत्र समूहों की माध्यक या वितरण समान हैं।
  • जब डेटा सामान्य नहीं है या स्केल केवल रैंक-आधारित है।
  • जब सैंपल साइज असमान हो।

परिकल्पना का निर्माण

  • शून्य परिकल्पना (H₀): दोनों समूहों का वितरण समान है।
  • वैकल्पिक परिकल्पना (H₁): दोनों समूहों के वितरण में महत्वपूर्ण अंतर है।

मैन–व्हिटनी यू परीक्षण की प्रक्रिया

  1. दो स्वतंत्र नमूने A और B लें, जिनके आकार क्रमशः n₁ और n₂ हैं।
  2. दोनों नमूनों को मिलाकर उन्हें आरोही क्रम में व्यवस्थित करें।
  3. प्रत्येक मान को रैंक प्रदान करें (सबसे छोटे को रैंक 1)।
  4. प्रत्येक समूह के लिए रैंकों का योग निकालें:
  5. R₁ = समूह 1 के रैंक का योग
    R₂ = समूह 2 के रैंक का योग

  6. U सांख्यिकी निम्न सूत्र से निकालें:
  7. U₁ = n₁n₂ + (n₁(n₁+1))/2 – R₁
    U₂ = n₁n₂ + (n₂(n₂+1))/2 – R₂

  8. U = छोटे मान का चयन करें (U = min(U₁, U₂))।
  9. तालिका या नॉर्मल एप्रॉक्सिमेशन से critical value की तुलना करें।

उदाहरण

मान लीजिए कि दो समूहों के छात्रों ने अलग-अलग शिक्षण विधियों से अध्ययन किया:

समूह A: 85, 78, 90, 88, 76
समूह B: 70, 82, 65, 80, 75

दोनों समूहों के सभी स्कोर को मिलाकर आरोही क्रम में व्यवस्थित करें:

65, 70, 75, 76, 78, 80, 82, 85, 88, 90

रैंक आवंटन:

  • समूह A = (4, 5, 8, 9, 10)
  • समूह B = (1, 2, 3, 6, 7)

अब:

  • R₁ = 4 + 5 + 8 + 9 + 10 = 36
  • R₂ = 1 + 2 + 3 + 6 + 7 = 19

U₁ = 5×5 + 5×6/2 – 36 = 25 + 15 – 36 = 4
U₂ = 5×5 + 5×6/2 – 19 = 25 + 15 – 19 = 21
U = 4 (छोटा मान)

α = 0.05 और n₁ = n₂ = 5 के लिए, critical value = 2 चूंकि 4 > 2, इसलिए H₀ अस्वीकार नहीं किया जाता। अर्थात शिक्षण विधियों के बीच कोई महत्वपूर्ण अंतर नहीं है।

नॉर्मल एप्रॉक्सिमेशन

यदि सैंपल साइज बड़ा है (n₁, n₂ ≥ 20), तो Normal approximation का उपयोग किया जाता है:

Z = (U – μU) / σU

जहाँ:

μU = (n₁n₂) / 2
σU = √[n₁n₂(n₁ + n₂ + 1) / 12]

मैन–व्हिटनी यू परीक्षण के लाभ

  • सामान्य वितरण की आवश्यकता नहीं।
  • Ordinal या रैंक आधारित डेटा पर लागू।
  • आउटलायर्स से कम प्रभावित।
  • छोटे सैंपल के लिए भी उपयुक्त।

सीमाएँ

  • केवल दो स्वतंत्र समूहों की तुलना के लिए उपयुक्त।
  • समान आकार और आकृति वाले वितरणों की मान्यता।
  • टाई रैंकों के मामलों में जटिल गणना।

डेटा साइंस में उपयोग

  • मॉडल A और मॉडल B के प्रदर्शन मापों की तुलना।
  • दो ग्राहक समूहों की संतुष्टि स्कोर तुलना।
  • मशीन लर्निंग मॉडल की त्रुटि दरों का विश्लेषण।
  • क्लिनिकल रिसर्च में दो उपचारों की तुलना।

निष्कर्ष

मैन–व्हिटनी यू परीक्षण नॉन-पैरामीट्रिक परीक्षणों में सबसे अधिक प्रयुक्त विधियों में से एक है। यह उन परिस्थितियों में अत्यंत उपयोगी है जहाँ डेटा सामान्य वितरण का पालन नहीं करता या स्केल मात्र रैंकिंग के रूप में उपलब्ध होता है। डेटा साइंस, रिसर्च और मशीन लर्निंग मॉडल मूल्यांकन में यह परीक्षण सांख्यिकीय निर्णय लेने का एक विश्वसनीय और लचीला तरीका प्रदान करता है।

Related Articles

Data Frame in R | R में डेटा फ़्रेम

R में डेटा फ़्रेम (Data Frame in R) परिचय R प्रोग...

Read More →

Linear Model in R | R में रैखिक मॉडल

R में रैखिक मॉडल (Linear Model in R) परिचय R प्रोग...

Read More →

Simulation in R | R में सिमुलेशन

R में सिमुलेशन (Simulation in R) परिचय सिमुलेश...

Read More →

Working with and Manipulating Data in R | R में डेटा पर कार्य करना और उसे संशोधित करना

R में डेटा पर कार्य करना और उसे संशोधित करना (Wo...

Read More →

Writing Data in R | R में डेटा लिखना

R में डेटा लिखना (Writing Data in R) परिचय डेटा व...

Read More →