"प्राकृतिक भाषा संसाधन": अवतरणों में अंतर

मुक्त ज्ञानकोश विकिपीडिया से
No edit summary
No edit summary
पंक्ति 1: पंक्ति 1:
'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कंप्यूटर विज्ञान]] और [[भाषा विज्ञान]] और मानव (प्राकृतिक) भाषाओं के कंप्यूटर के बीच बातचीत के  संबंध का एक क्षेत्र है। <ref>Charnia, Eugene: ''Introduction to प्राकृतिक भाषा संसाधन (एनएलपी) पाठ को विश्लेषित करने के लिए कम्प्यूटरीकृत दृष्टिकोण है जो कि प्रौद्योगिकी और सिद्धांतों के दोनों वर्गों पर आधारित है और अनुसंधान और विकास के क्षेत्र में यह बहुत सक्रिय है।artificial intelligence'', page 2. Addison-Wesley, 1984.</ref>
'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कंप्यूटर विज्ञान]] और [[भाषा विज्ञान]] और मानव (प्राकृतिक) भाषाओं के कंप्यूटर के बीच बातचीत के  संबंध का एक क्षेत्र है। <ref>Charnia, Eugene: ''Introduction to प्राकृतिक भाषा संसाधन (एनएलपी) पाठ को विश्लेषित करने के लिए कम्प्यूटरीकृत दृष्टिकोण है जो कि प्रौद्योगिकी और सिद्धांतों के दोनों वर्गों पर आधारित है और अनुसंधान और विकास के क्षेत्र में यह बहुत सक्रिय है। artificial intelligence'', page 2. Addison-Wesley, 1984.</ref>


==कठिनाइयाँ==
कम्प्यूटर द्वारा प्राकृतिक भाषा संसाधन करने में प्रमुख कठिनाइयाँ हैं-
# '''संदिग्धता'''
# '''शब्दों के आरम्भ और अन्त का सही पता लगाने की समस्या''' - बोली गयी भाषा में प्रायः शब्दों की सीमा का थीक-ठीक निर्धारण करना कठिन होता है। कुछ लिखित भाषाओं (जैसे [[मन्दारिन]]) में शब्दों के बीच जगह नहीं छोड़ी जाती जिससे शब्दों की सीमा का ठीक से पता करना और उन्हें अलग करना कठिन है।
# '''गलत आंकड़े''' - इसके अलावा शब्दों के टंकण की गलती, गलत वर्तनी, गलत उच्चारण, [[ओसीआर]] से प्राप्त टेक्स्ट में गलती आदि से भी सही शब्दों का पता नहीं चल पाता।

==प्रक्रिया==
* मार्फोलोजिक विश्लेषण
* सिन्टैक्टिकल विश्लेषण
* सिमैन्टिक विश्लेषण
* प्रैग्मटिक विश्लेषण - सन्दर्भ आदि का ध्यान रखना
* वाक्य की योजना बनाना
* वाक्यनिर्माण

==प्रमुख अनुप्रयोग==
कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-
कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-
 
 
पंक्ति 8: पंक्ति 23:
# सारांशीकरण (summerization)
# सारांशीकरण (summerization)
# प्रश्नों के उत्तर देना
# प्रश्नों के उत्तर देना
# [[संगणकीय भाषाविज्ञान]]
# कम्प्यूटेशनल भाषा विज्ञान  
# डाटा खनन (डेटा माइनिंग)
# [[डाटा माइनिंग|डाटा खनन]] (डेटा माइनिंग)
# भाषा तकनीक
# प्राकृतिक भाषा को समझना
# प्राकृतिक भाषा समझ
# अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष
# अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष

==इन्हें भी देखें==
*[[भाषा संगणन]]


==सन्दर्भ==
==सन्दर्भ==

06:17, 4 मार्च 2014 का अवतरण

प्राकृतिक भाषा संसाधन (एनएलपी) कंप्यूटर विज्ञान और भाषा विज्ञान और मानव (प्राकृतिक) भाषाओं के कंप्यूटर के बीच बातचीत के  संबंध का एक क्षेत्र है। [1]

कठिनाइयाँ

कम्प्यूटर द्वारा प्राकृतिक भाषा संसाधन करने में प्रमुख कठिनाइयाँ हैं-

  1. संदिग्धता
  2. शब्दों के आरम्भ और अन्त का सही पता लगाने की समस्या - बोली गयी भाषा में प्रायः शब्दों की सीमा का थीक-ठीक निर्धारण करना कठिन होता है। कुछ लिखित भाषाओं (जैसे मन्दारिन) में शब्दों के बीच जगह नहीं छोड़ी जाती जिससे शब्दों की सीमा का ठीक से पता करना और उन्हें अलग करना कठिन है।
  3. गलत आंकड़े - इसके अलावा शब्दों के टंकण की गलती, गलत वर्तनी, गलत उच्चारण, ओसीआर से प्राप्त टेक्स्ट में गलती आदि से भी सही शब्दों का पता नहीं चल पाता।

प्रक्रिया

  • मार्फोलोजिक विश्लेषण
  • सिन्टैक्टिकल विश्लेषण
  • सिमैन्टिक विश्लेषण
  • प्रैग्मटिक विश्लेषण - सन्दर्भ आदि का ध्यान रखना
  • वाक्य की योजना बनाना
  • वाक्यनिर्माण

प्रमुख अनुप्रयोग

कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-  

  1. मशीनी अनुवाद
  2. पाठ सरलीकरण
  3. सूचना निष्कर्षण (इन्फार्मेशन इक्सट्रैक्सन)
  4. सारांशीकरण (summerization)
  5. प्रश्नों के उत्तर देना
  6. संगणकीय भाषाविज्ञान
  7. डाटा खनन (डेटा माइनिंग)
  8. प्राकृतिक भाषा को समझना
  9. अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष

इन्हें भी देखें

सन्दर्भ

  1. Charnia, Eugene: Introduction to प्राकृतिक भाषा संसाधन (एनएलपी) पाठ को विश्लेषित करने के लिए कम्प्यूटरीकृत दृष्टिकोण है जो कि प्रौद्योगिकी और सिद्धांतों के दोनों वर्गों पर आधारित है और अनुसंधान और विकास के क्षेत्र में यह बहुत सक्रिय है। artificial intelligence, page 2. Addison-Wesley, 1984.