मानक विचलन एक सांख्यिकीय माप है जो डेटा मूल्यों के सेट में परिवर्तन या विघटन की मात्रा को मापता है. यह दिखाता है कि डेटासेट के मीन (औसत) से व्यक्तिगत डेटा पॉइंट कितना अलग हैं. कम मानक विचलन से पता चलता है कि डेटा पॉइंट का अर्थ इसके करीब है, जबकि उच्च मानक विचलन से पता चलता है कि डेटा व्यापक रेंज में फैल जाता है. स्टैंडर्ड डेविएशन का इस्तेमाल आमतौर पर फाइनेंस, साइंस और इंजीनियरिंग जैसे क्षेत्रों में उतार-चढ़ाव का आकलन करने, जोखिम का अनुमान लगाने और डेटा वितरण को समझने के लिए किया जाता है. यह वेरिएंस का वर्गमूल है, जो स्प्रेड का अधिक व्याख्यात्मक माप प्रदान करता है.
स्टैंडर्ड डेविएशन (एसडी) सांख्यिकी में एक मूलभूत अवधारणा है जो डेटासेट के मीन (औसत) के आसपास डेटा पॉइंट्स के विसर्जन या प्रसार को मापता है. यह हमें यह समझता है कि औसतन, व्यक्तिगत डेटा पॉइंट कितने दूर हैं, डेटा में परिवर्तनशीलता को समझने में मदद करते हैं.
- मानक विचलन के लिए फॉर्मूला:
जनसंख्या के लिए (यानी, पूरे डेटासेट), मानक विचलन की गणना निम्नलिखित फॉर्मूला का उपयोग करके की जाती है:
जहां:
- SN जनसंख्या मानक विचलन है.
- n जनसंख्या में डेटा पॉइंट की संख्या है.
- xi प्रत्येक डेटा पॉइंट को दर्शाता है.
- μ जनसंख्या का अर्थ है (औसत).
- n सभी डेटा पॉइंट पर राशि को दर्शाता है.
एक नमूने के लिए (यानी, जनसंख्या का एक सबसेट), फॉर्मूला छोटे आकार के हिसाब से थोड़ा एडजस्ट किया जाता है और कम अनुमानित वेरिएबिलिटी से बचता है:
एस=
जहां:
- s सैंपल स्टैंडर्ड डेविएशन है.
- n सैंपल में डेटा पॉइंट की संख्या है.
- X है सैंपल का मतलब है.
- मानक विचलन की गणना करने के चरण:
- मतलब की गणना करें: डेटासेट की औसत खोजें. यह सभी डेटा पॉइंट को जोड़कर और कुल डेटा पॉइंट से विभाजित करके किया जाता है.
μ = iN=1xi/N
माध्यम से अंतर खोजें: प्रत्येक वैल्यू का मतलब यह निर्धारित करने के लिए प्रत्येक डेटा पॉइंट से घटाएं.
- वर्ग अंतर: चरण 2 में प्राप्त प्रत्येक अंतर को वर्ग करें. यह चरण यह सुनिश्चित करता है कि नकारात्मक और सकारात्मक विचलन एक-दूसरे को कैंसल नहीं करते हैं.
- औसत वर्ग अंतर: जनसंख्या के लिए, एनएनएन (डेटा पॉइंट्स की संख्या) से विभाजित करके इन वर्ग अंतरों का औसत खोजें. सैंपल के लिए, सैंपल साइज़ के लिए n − 1 से विभाजित करें और पक्षपात को कम करें.
- वर्गमूल लें: अंत में, चरण 4 से परिणाम का वर्गमूल लें. यह मानक विचलन देता है.
- मानक विचलन की व्याख्या करना:
- कम मानक विचलन: एक छोटा मानक विचलन का अर्थ होता है डेटा पॉइंट का अर्थ होता है. डेटा को टाइटली क्लस्टर किया जाता है, जो कम वेरिएबिलिटी या कंसिस्टेंसी को दर्शाता है.
- उच्च मानक विचलन: एक बड़े मानक विचलन का अर्थ होता है कि डेटा पॉइंट वैल्यू की विस्तृत रेंज में फैले होते हैं. यह डेटासेट में उच्च वेरिएबिलिटी और अधिक अनिश्चितता को दर्शाता है.
उदाहरण के लिए, अगर आपके पास एक ही माध्यम से दो डेटासेट हैं:
- डेटासेट 1: [10, 11, 9, 10, 10]
- डेटासेट 2: [1, 20, 5, 16, 9]
हालांकि दोनों का एक ही मतलब (10) है, डेटासेट 1 में बहुत कम वेरिएबिलिटी है, इसलिए इसका स्टैंडर्ड डेविएशन डेटासेट 2 से कम होगा.
- मानक विचलन के उपयोग:
- फाइनेंस और इन्वेस्टमेंट: स्टैंडर्ड डेविएशन का उपयोग किसी एसेट के उतार-चढ़ाव या जोखिम को मापने के लिए किया जाता है, जैसे कि स्टॉक या पोर्टफोलियो. उच्च स्टैंडर्ड डेविएशन कीमत के उतार-चढ़ाव को दर्शाता है, जो अधिक जोखिम को दर्शाता है.
- क्वॉलिटी कंट्रोल: मैन्युफैक्चरिंग में, स्टैंडर्ड डेविएशन प्रोडक्ट की स्थिरता का आकलन करने में मदद करता है. उत्पादन माप में एक छोटे मानक विचलन से पता चलता है कि उत्पादों को उच्च सटीकता के साथ उत्पादित किया जा रहा है.
- आंकड़े: डेटा के प्रसार को समझने और आत्मविश्वास अंतराल, रिग्रेशन मॉडल और हाइपोथेसिस टेस्ट जैसे अन्य सांख्यिकीय उपायों की गणना करने के लिए मानक विचलन का उपयोग किया जाता है.
- सामान्य वितरण से संबंध:
सामान्य वितरण (बेल-आकार के वक्र) में, के बारे में:
- डेटा का 68% 1 मानक विचलन के भीतर आता है,
- 95% 2 मानक विचलनों के भीतर आता है, और
- 99.7% 3 स्टैंडर्ड डेविएशन के भीतर आता है.
इसे 68-95-99.7 नियम या एम्पिरिकल नियम के रूप में जाना जाता है, जो यह दर्शाता है कि डेटा के वितरण को समझने में स्टैंडर्ड डेविएशन कैसे महत्वपूर्ण भूमिका निभाता है.
- उदाहरण:
निम्नलिखित डेटासेट पर विचार करें: [4, 8, 6, 5, 3]
चरण 1: औसत (μ) की गणना करें:
μ=4+8+6+5+3/5=5.2
चरण 2: प्रत्येक डेटा पॉइंट और स्क्वेयर परिणाम से अर्थ घटाएं:
(4−5.2)2=1.44,
(8−5.2)2=7.84,
(6−5.2)2=0.64,
(5−5.2)2=0.04,
(3−5.2)2=4.84
चरण 3: औसत स्क्वेर्ड अंतर (सैम्पल स्टैंडर्ड डेविएशन के लिए, n − 1=4 से विभाजित करें):
1.44+7.84+0.64+0.04+4.84/4=3.20
चरण 4: 3.20 का वर्गमूल लें:
s=√3.20≈1.79
इस प्रकार, डेटासेट का मानक विचलन लगभग 1.79 है.
निष्कर्ष:
स्टैंडर्ड डेविएशन एक शक्तिशाली सांख्यिकीय टूल है जो डेटासेट में परिवर्तनशीलता की मात्रा को निर्धारित करने में मदद करता है. इसका उपयोग रिस्क का आकलन करने, निरंतरता को मापने और डेटा डिस्ट्रीब्यूशन को समझने के लिए विभिन्न प्रकार के एप्लीकेशन में किया जाता है. हालांकि बड़े डेटासेट की गणना करना थोड़ा अधिक जटिल हो सकता है, लेकिन यह डेटा के प्रसार के बारे में मूल्यवान जानकारी प्रदान करता है और इसका व्यापक रूप से फाइनेंस, इंजीनियरिंग और रिसर्च जैसे क्षेत्रों में उपयोग किया जाता है.







