Sign Test in Non-Parametric Inference | नॉन-पैरामीट्रिक अनुमान में साइन परीक्षण

Sign Test in Non-Parametric Inference | नॉन-पैरामीट्रिक अनुमान में साइन परीक्षण


साइन परीक्षण (Sign Test)

परिचय

सांख्यिकी और डेटा साइंस में जब हमें दो संबंधित नमूनों या किसी माध्यक (Median) के बारे में निर्णय लेना होता है, तो साइन परीक्षण (Sign Test) का उपयोग किया जाता है। यह एक सरल और प्रभावी नॉन-पैरामीट्रिक (Non-Parametric) विधि है, जो किसी वितरण (Distribution) के रूप या मानकों पर निर्भर नहीं करती। साइन टेस्ट का मुख्य उद्देश्य यह निर्धारित करना है कि क्या किसी डेटा सेट में माध्यक (Median) किसी विशेष मान से भिन्न है या नहीं।

साइन टेस्ट केवल डेटा के दिशा-निर्देश (sign) को देखता है — अर्थात् अंतर (Difference) सकारात्मक (+) है या नकारात्मक (–)। यह परिमाण (Magnitude) पर ध्यान नहीं देता। इसलिए यह “distribution-free test” कहलाता है।

साइन परीक्षण की आवश्यकता

  • जब डेटा सामान्य वितरण (Normal Distribution) का पालन नहीं करता।
  • जब नमूना आकार छोटा हो और पैरामीट्रिक टेस्ट उपयुक्त न हो।
  • जब केवल दिशा (सकारात्मक या नकारात्मक परिवर्तन) महत्वपूर्ण हो।
  • जब हम माध्यक (Median) के बारे में परिकल्पना जाँचना चाहते हों।

परिकल्पना का निर्माण

साइन टेस्ट के लिए दो परिकल्पनाएँ होती हैं:

  • शून्य परिकल्पना (H₀): माध्यक एक निर्दिष्ट मान (m₀) के बराबर है।
  • वैकल्पिक परिकल्पना (H₁): माध्यक उस मान से भिन्न है।

H₀: Median = m₀ H₁: Median ≠ m₀

साइन टेस्ट की प्रक्रिया

  1. प्रत्येक अवलोकन और निर्दिष्ट माध्यक (m₀) के बीच अंतर निकालें।
  2. यदि अंतर सकारात्मक है, तो + चिन्ह लगाएँ; यदि नकारात्मक है, तो – चिन्ह लगाएँ।
  3. जिन अवलोकनों में अंतर = 0 है, उन्हें छोड़ दें।
  4. सकारात्मक (+) और नकारात्मक (–) चिन्हों की संख्या गिनें।
  5. कम संख्या वाले चिन्हों की संख्या को परीक्षण सांख्यिकी (Test Statistic) के रूप में लें।
  6. Binomial वितरण के आधार पर निर्णय लें।

उदाहरण

मान लीजिए किसी कंपनी ने दावा किया कि उसके कर्मचारियों की औसत उत्पादकता माध्यक 50 है। 10 कर्मचारियों के नमूने के स्कोर निम्नलिखित हैं:

48, 52, 45, 55, 47, 51, 49, 53, 46, 54

m₀ = 50 अंतर: (-, +, -, +, -, +, -, +, -, +) सकारात्मक = 5, नकारात्मक = 5 कुल = 10

यह एक संतुलित परिणाम है। इसलिए हम निष्कर्ष निकालते हैं कि माध्यक 50 से सांख्यिकीय रूप से भिन्न नहीं है।

साइन परीक्षण के प्रकार

  • 1. एक-नमूना साइन टेस्ट (One-Sample Sign Test): किसी दिए गए माध्यक की तुलना के लिए।
  • 2. युग्मित साइन टेस्ट (Paired Sign Test): दो संबंधित नमूनों के बीच अंतर की जाँच के लिए।
  • 3. द्वि-दिशीय साइन टेस्ट (Two-Sided Test): जब परिवर्तन किसी भी दिशा में हो सकता है।

परीक्षण सांख्यिकी (Test Statistic)

यदि n प्रभावी अवलोकन हैं और p = 0.5 (सकारात्मक चिन्ह की संभावना), तो परीक्षण सांख्यिकी X ~ Binomial (n, 0.5) का पालन करता है।

H₀ को अस्वीकार करें यदि:

  • दो तरफा परीक्षण में X अत्यधिक छोटा या बड़ा हो।
  • p-value < α (महत्व स्तर)।

नॉर्मल एप्रॉक्सिमेशन

यदि n बड़ा है (n > 20), तो Binomial वितरण को Normal वितरण द्वारा निकटता से प्रदर्शित किया जा सकता है:

Z = (X – n/2) / √(n/4)

डेटा साइंस में साइन टेस्ट का उपयोग

  • जब मॉडल या सिस्टम में बदलाव का प्रभाव जांचना हो।
  • मॉडल वैलिडेशन में दो संस्करणों की तुलना के लिए।
  • कस्टमर सैटिस्फैक्शन सर्वे में माध्यक रेटिंग तुलना।
  • मेडिकल ट्रायल्स में उपचार प्रभाव का निर्धारण।

लाभ

  • सरल और आसानी से लागू।
  • वितरण की मान्यता की आवश्यकता नहीं।
  • छोटे नमूनों पर भी उपयोगी।

सीमाएँ

  • डेटा के परिमाण को नज़रअंदाज़ करता है।
  • कम सांख्यिकीय शक्ति (Low Power)।
  • समान माध्यक वाले डेटा पर सीमित जानकारी।

निष्कर्ष

साइन टेस्ट एक सरल लेकिन प्रभावी नॉन-पैरामीट्रिक परीक्षण है जो डेटा की दिशा पर आधारित निर्णय लेने में सहायक होता है। यह विधि विशेष रूप से उन स्थितियों में उपयोगी है जहाँ डेटा का वितरण अज्ञात है या पारंपरिक पैरामीट्रिक परीक्षण लागू नहीं किए जा सकते। डेटा साइंस और सांख्यिकी में यह परीक्षण मॉडल तुलना और निष्कर्ष निकालने के लिए अत्यंत विश्वसनीय है।

Related Articles

Data Frame in R | R में डेटा फ़्रेम

R में डेटा फ़्रेम (Data Frame in R) परिचय R प्रोग...

Read More →

Linear Model in R | R में रैखिक मॉडल

R में रैखिक मॉडल (Linear Model in R) परिचय R प्रोग...

Read More →

Simulation in R | R में सिमुलेशन

R में सिमुलेशन (Simulation in R) परिचय सिमुलेश...

Read More →

Working with and Manipulating Data in R | R में डेटा पर कार्य करना और उसे संशोधित करना

R में डेटा पर कार्य करना और उसे संशोधित करना (Wo...

Read More →

Writing Data in R | R में डेटा लिखना

R में डेटा लिखना (Writing Data in R) परिचय डेटा व...

Read More →