"प्राकृतिक भाषा संसाधन": अवतरणों में अंतर

Content deleted Content added

Inline

06:17, 4 मार्च 2014 का अवतरण

प्राकृतिक भाषा संसाधन (एनएलपी) कंप्यूटर विज्ञान और भाषा विज्ञान और मानव (प्राकृतिक) भाषाओं के कंप्यूटर के बीच बातचीत के संबंध का एक क्षेत्र है। ^[1]

कठिनाइयाँ

कम्प्यूटर द्वारा प्राकृतिक भाषा संसाधन करने में प्रमुख कठिनाइयाँ हैं-

संदिग्धता
शब्दों के आरम्भ और अन्त का सही पता लगाने की समस्या - बोली गयी भाषा में प्रायः शब्दों की सीमा का थीक-ठीक निर्धारण करना कठिन होता है। कुछ लिखित भाषाओं (जैसे मन्दारिन) में शब्दों के बीच जगह नहीं छोड़ी जाती जिससे शब्दों की सीमा का ठीक से पता करना और उन्हें अलग करना कठिन है।
गलत आंकड़े - इसके अलावा शब्दों के टंकण की गलती, गलत वर्तनी, गलत उच्चारण, ओसीआर से प्राप्त टेक्स्ट में गलती आदि से भी सही शब्दों का पता नहीं चल पाता।

प्रक्रिया

मार्फोलोजिक विश्लेषण
सिन्टैक्टिकल विश्लेषण
सिमैन्टिक विश्लेषण
प्रैग्मटिक विश्लेषण - सन्दर्भ आदि का ध्यान रखना
वाक्य की योजना बनाना
वाक्यनिर्माण

प्रमुख अनुप्रयोग

कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-

मशीनी अनुवाद
पाठ सरलीकरण
सूचना निष्कर्षण (इन्फार्मेशन इक्सट्रैक्सन)
सारांशीकरण (summerization)
प्रश्नों के उत्तर देना
संगणकीय भाषाविज्ञान
डाटा खनन (डेटा माइनिंग)
प्राकृतिक भाषा को समझना
अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष

इन्हें भी देखें

भाषा संगणन

सन्दर्भ

↑ Charnia, Eugene: Introduction to प्राकृतिक भाषा संसाधन (एनएलपी) पाठ को विश्लेषित करने के लिए कम्प्यूटरीकृत दृष्टिकोण है जो कि प्रौद्योगिकी और सिद्धांतों के दोनों वर्गों पर आधारित है और अनुसंधान और विकास के क्षेत्र में यह बहुत सक्रिय है। artificial intelligence, page 2. Addison-Wesley, 1984.

[1] Charnia, Eugene: Introduction to प्राकृतिक भाषा संसाधन (एनएलपी) पाठ को विश्लेषित करने के लिए कम्प्यूटरीकृत दृष्टिकोण है जो कि प्रौद्योगिकी और सिद्धांतों के दोनों वर्गों पर आधारित है और अनुसंधान और विकास के क्षेत्र में यह बहुत सक्रिय है। artificial intelligence, page 2. Addison-Wesley, 1984.

[1]

@@ पंक्ति 1: / पंक्ति 1: @@
-'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कंप्यूटर विज्ञान]] और [[भाषा विज्ञान]] और मानव (प्राकृतिक) भाषाओं के कंप्यूटर के बीच बातचीत के  संबंध का एक क्षेत्र है। <ref>Charnia, Eugene: ''Introduction to प्राकृतिक भाषा संसाधन (एनएलपी) पाठ को विश्लेषित करने के लिए कम्प्यूटरीकृत दृष्टिकोण है जो कि प्रौद्योगिकी और सिद्धांतों के दोनों वर्गों पर आधारित है और अनुसंधान और विकास के क्षेत्र में यह बहुत सक्रिय है।artificial intelligence'', page 2. Addison-Wesley, 1984.</ref>
+'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कंप्यूटर विज्ञान]] और [[भाषा विज्ञान]] और मानव (प्राकृतिक) भाषाओं के कंप्यूटर के बीच बातचीत के  संबंध का एक क्षेत्र है। <ref>Charnia, Eugene: ''Introduction to प्राकृतिक भाषा संसाधन (एनएलपी) पाठ को विश्लेषित करने के लिए कम्प्यूटरीकृत दृष्टिकोण है जो कि प्रौद्योगिकी और सिद्धांतों के दोनों वर्गों पर आधारित है और अनुसंधान और विकास के क्षेत्र में यह बहुत सक्रिय है। artificial intelligence'', page 2. Addison-Wesley, 1984.</ref>
+==कठिनाइयाँ==
+कम्प्यूटर द्वारा प्राकृतिक भाषा संसाधन करने में प्रमुख कठिनाइयाँ हैं-
+# '''संदिग्धता'''
+# '''शब्दों के आरम्भ और अन्त का सही पता लगाने की समस्या''' - बोली गयी भाषा में प्रायः शब्दों की सीमा का थीक-ठीक निर्धारण करना कठिन होता है। कुछ लिखित भाषाओं (जैसे [[मन्दारिन]]) में शब्दों के बीच जगह नहीं छोड़ी जाती जिससे शब्दों की सीमा का ठीक से पता करना और उन्हें अलग करना कठिन है।
+# '''गलत आंकड़े''' - इसके अलावा शब्दों के टंकण की गलती, गलत वर्तनी, गलत उच्चारण, [[ओसीआर]] से प्राप्त टेक्स्ट में गलती आदि से भी सही शब्दों का पता नहीं चल पाता।
+==प्रक्रिया==
+* मार्फोलोजिक विश्लेषण
+* सिन्टैक्टिकल विश्लेषण
+* सिमैन्टिक विश्लेषण
+* प्रैग्मटिक विश्लेषण - सन्दर्भ आदि का ध्यान रखना
+* वाक्य की योजना बनाना
+* वाक्यनिर्माण
+==प्रमुख अनुप्रयोग==
 कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-
@@ पंक्ति 8: / पंक्ति 23: @@
 # सारांशीकरण (summerization)
 # प्रश्नों के उत्तर देना
+# [[संगणकीय भाषाविज्ञान]]
-# कम्प्यूटेशनल भाषा विज्ञान
-# डाटा खनन (डेटा माइनिंग)
+# [[डाटा माइनिंग|डाटा खनन]] (डेटा माइनिंग)
-# भाषा तकनीक
+# प्राकृतिक भाषा को समझना
-# प्राकृतिक भाषा समझ
 # अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष
+==इन्हें भी देखें==
+*[[भाषा संगणन]]
 ==सन्दर्भ==