सामग्री पर जाएँ

विवरणात्मक सांख्यिकी

मुक्त ज्ञानकोश विकिपीडिया से

वर्णनात्मक सांख्यिकी (गणना संज्ञा अर्थ में) उस सांख्यिकी अथवा आँकड़ों को कहते हैं जो सूचना के संग्रह से विशेषताओं का मात्रात्मक वर्णन या सारांश देता है,[1] जबकि वर्णनात्मक सांख्यिकी (परिणामवाचक संज्ञा के अर्थ में) उस सांख्यिकी का उपयोग और विश्लेषण करने की प्रक्रिया है। वर्णनात्मक सांख्यिकी को अनुमिति सांख्यिकी (या आगमनात्मक सांख्यिकी) से अलग किया जाता है, जिसका उद्देश्य किसी प्रतिचयन को संक्षेप में प्रस्तुत करना होता है, न कि उस जनसंख्या के बारे में जानने के लिए डेटा का उपयोग करना जिसे डेटा का नमूना प्रतिनिधित्व करने वाला माना जाता है।[2] आम तौर पर इसका मतलब यह है कि वर्णनात्मक सांख्यिकी, अनुमानात्मक सांख्यिकी के विपरीत, संभाव्यता सिद्धांत के आधार पर विकसित नहीं किए जाते हैं, और अक्सर प्राचल रहित सांख्यिकी होती हैं।[3] यहां तक कि जब कोई डेटा विश्लेषण अनुमानित आंकड़ों का उपयोग करके अपने मुख्य निष्कर्ष निकालता है, तो वर्णनात्मक आंकड़े भी आम तौर पर प्रस्तुत किए जाते हैं। [4] उदाहरण के लिए, मानव विषयों पर रिपोर्टिंग करने वाले कागजात में, आम तौर पर एक तालिका शामिल होती है जिसमें समग्र नमूना आकार, महत्वपूर्ण उपसमूहों में नमूना आकार (उदाहरण के लिए, प्रत्येक उपचार या एक्सपोजर समूह के लिए), और जनसांख्यिकीय या नैदानिक विशेषताएं जैसे औसत आयु, अनुपात दिया जाता है। प्रत्येक लिंग के विषयों का, संबंधित सह-रुग्णताओं वाले विषयों का अनुपात आदि।

कुछ उपाय जो आमतौर पर डेटा सेट का वर्णन करने के लिए उपयोग किए जाते हैं वे केंद्रीय प्रवृत्ति के उपाय और परिवर्तनशीलता या फैलाव के उपाय हैं। केंद्रीय प्रवृत्ति के माप में माध्य, माध्यिका और मोड शामिल हैं, जबकि परिवर्तनशीलता के माप में मानक विचलन (या विचरण ), चर के न्यूनतम और अधिकतम मान, कर्टोसिस और तिरछापन शामिल हैं। [5]

सांख्यिकीय विश्लेषण में उपयोग करें

[संपादित करें]

वर्णनात्मक सांख्यिकी प्रतिचयन के बारे में और किए गए अवलोकनों के बारे में सरल सारांश प्रदान करते हैं। ऐसे सारांश या तो मात्रात्मक हो सकते हैं, यानी सारांश सांख्यिकी, या दृश्य, यानी समझने में आसान ग्राफ़। ये सारांश या तो अधिक व्यापक सांख्यिकीय विश्लेषण के हिस्से के रूप में डेटा के प्रारंभिक विवरण का आधार बन सकते हैं, या वे किसी विशेष जांच के लिए अपने आप में पर्याप्त हो सकते हैं।

उदाहरण के लिए, बास्केटबॉल में शूटिंग प्रतिशत एक वर्णनात्मक सांख्यिकी है जो किसी खिलाड़ी या टीम के प्रदर्शन का सारांश प्रस्तुत करता है। यह संख्या मारे गए शॉट्स की संख्या को लिए गए शॉट्स की संख्या से विभाजित करने पर प्राप्त होती है। उदाहरण के लिए, 33% शॉट लगाने वाला खिलाड़ी हर तीन में लगभग एक शॉट लगा रहा है। प्रतिशत कई अलग-अलग घटनाओं का सारांश या वर्णन करता है। ग्रेड प्वाइंट औसत पर भी विचार करें। यह एकल संख्या किसी छात्र के पाठ्यक्रम के अनुभवों की सीमा में उसके सामान्य प्रदर्शन का वर्णन करती है। [6]

वर्णनात्मक और सारांश सांख्यिकी के उपयोग का एक व्यापक इतिहास है और वास्तव में, जनसंख्या और आर्थिक डेटा का सरल सारणीकरण ही सांख्यिकी का विषय सामने आने का पहला तरीका था। हाल ही में, खोजपूर्ण डेटा विश्लेषण के शीर्षक के तहत सारांश तकनीकों का एक संग्रह तैयार किया गया है: ऐसी तकनीक का एक उदाहरण बॉक्स प्लॉट है।

व्यवसाय जगत में, वर्णनात्मक सांख्यिकी कई प्रकार के डेटा का उपयोगी सारांश प्रदान करते हैं। उदाहरण के लिए, निवेशक और दलाल भविष्य में बेहतर निवेश निर्णय लेने के लिए अपने निवेश पर अनुभवजन्य और विश्लेषणात्मक विश्लेषण करके रिटर्न व्यवहार के ऐतिहासिक खाते का उपयोग कर सकते हैं।

वस्तु के एक प्रकार विश्लेषण

[संपादित करें]

यूनीवेरिएट विश्लेषण में एकल चर के वितरण का वर्णन करना शामिल है, जिसमें इसकी केंद्रीय प्रवृत्ति ( माध्य, मध्यिका और मोड सहित) और फैलाव (डेटा-सेट की सीमा और चतुर्थक सहित, और फैलाव और मानक विचलन जैसे प्रसार के उपाय शामिल हैं) ). वितरण के आकार को तिरछापन और कर्टोसिस जैसे सूचकांकों के माध्यम से भी वर्णित किया जा सकता है। किसी चर के वितरण की विशेषताओं को ग्राफिकल या सारणीबद्ध प्रारूप में भी दर्शाया जा सकता है, जिसमें हिस्टोग्राम और स्टेम-एंड-लीफ डिस्प्ले शामिल हैं।

द्विचर और बहुभिन्नरूपी विश्लेषण

[संपादित करें]

जब किसी नमूने में एक से अधिक चर होते हैं, तो चर के जोड़े के बीच संबंध का वर्णन करने के लिए वर्णनात्मक आंकड़ों का उपयोग किया जा सकता है। इस मामले में, वर्णनात्मक सांख्यिकी में शामिल हैं:

  • क्रॉस-टेब्यूलेशन और आकस्मिकता तालिकाएँ
  • स्कैटरप्लॉट के माध्यम से चित्रमय प्रतिनिधित्व
  • निर्भरता के मात्रात्मक उपाय
  • सशर्त वितरण का विवरण

अविभाज्य और द्विचर विश्लेषण को अलग करने का मुख्य कारण यह है कि द्विचर विश्लेषण न केवल एक सरल वर्णनात्मक विश्लेषण है, बल्कि यह दो अलग-अलग चर के बीच संबंध का भी वर्णन करता है। [7] निर्भरता के मात्रात्मक उपायों में सहसंबंध शामिल है (जैसे कि पियर्सन का आर जब दोनों चर निरंतर होते हैं, या स्पीयरमैन का आरएचओ यदि एक या दोनों नहीं होते हैं) और सहप्रसरण (जो दर्शाता है कि पैमाने पर चर को मापा जाता है)। प्रतिगमन विश्लेषण में ढलान, चर के बीच संबंध को भी दर्शाता है। अमानकीकृत ढलान भविष्यवक्ता में एक इकाई परिवर्तन के लिए मानदंड चर में इकाई परिवर्तन को इंगित करता है। मानकीकृत ढलान मानकीकृत ( जेड-स्कोर ) इकाइयों में इस परिवर्तन को इंगित करता है। अत्यधिक विषम डेटा को अक्सर लघुगणक लेकर रूपांतरित किया जाता है। लघुगणक का उपयोग ग्राफ़ को अधिक सममित बनाता है और सामान्य वितरण के समान दिखता है, जिससे उन्हें सहज रूप से व्याख्या करना आसान हो जाता है। [8] :47

सन्दर्भ

[संपादित करें]
  1. Mann, Prem S. (1995). Introductory Statistics (2nd संस्करण). Wiley. आई॰ऍस॰बी॰ऍन॰ 0-471-31009-3.
  2. "Drawing Conclusions From Data: Descriptive Statistics, Inferential Statistics, and Hypothesis Testing", Interpreting and Using Statistics in Psychological Research, Thousand Oaks, CA: SAGE Publications, Inc, पपृ॰ 145–183, 2017, आई॰ऍस॰बी॰ऍन॰ 978-1-5063-0416-8, डीओआइ:10.4135/9781506304144.n6, अभिगमन तिथि 2021-06-01
  3. Dodge, Y. (2003). The Oxford Dictionary of Statistical Terms. OUP. आई॰ऍस॰बी॰ऍन॰ 0-19-850994-4.
  4. "Drawing Conclusions From Data: Descriptive Statistics, Inferential Statistics, and Hypothesis Testing", Interpreting and Using Statistics in Psychological Research, Thousand Oaks, CA: SAGE Publications, Inc, पपृ॰ 145–183, 2017, आई॰ऍस॰बी॰ऍन॰ 978-1-5063-0416-8, डीओआइ:10.4135/9781506304144.n6, अभिगमन तिथि 2021-06-01
  5. Investopedia, Descriptive Statistics Terms
  6. Trochim, William M. K. (2006). "Descriptive statistics". Research Methods Knowledge Base. अभिगमन तिथि 14 March 2011.
  7. Babbie, Earl R. (2009). The Practice of Social Research (12th संस्करण). Wadsworth. पपृ॰ 436–440. आई॰ऍस॰बी॰ऍन॰ 978-0-495-59841-1.
  8. Nick, Todd G. (2007). "Descriptive Statistics". Topics in Biostatistics. Methods in Molecular Biology. 404. New York: Springer. पपृ॰ 33–52. PMID 18450044. आई॰ऍस॰बी॰ऍन॰ 978-1-58829-531-6. डीओआइ:10.1007/978-1-59745-530-5_3.