"प्राकृतिक भाषा संसाधन": अवतरणों में अंतर

मुक्त ज्ञानकोश विकिपीडिया से
No edit summary
No edit summary
पंक्ति 1: पंक्ति 1:
'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कंप्यूटर विज्ञान]], [[कृत्रिम बुद्धि]] तथा [[भाषा विज्ञान]] का एक क्षेत्र है तथा मानव (प्राकृतिक) भाषाओं और [[कंप्यूटर]] के अन्तःक्रियाओं से सम्बन्धित है। <ref>Charnia, Eugene: ''Introduction to artificial intelligence'', page 2. Addison-Wesley, 1984.</ref> प्राकृतिक भाषा संसाधन, कम्प्यूटर के द्वारा, मानव द्वारा कही या लिखी भाषा से अर्थ निकालने का काम करता है। इसके अलावा प्राकृतिक भाषा का सृजन (लिखित या वाचित रूप में) करने के लिए भी एनएलपी प्रयुक्त होता है।
'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कम्प्यूटर विज्ञान]], [[कृत्रिम बुद्धि]] तथा [[भाषा विज्ञान]] का एक क्षेत्र है तथा मानव (प्राकृतिक) भाषाओं और [[कंप्यूटर]] के अन्तःक्रियाओं से सम्बन्धित है। <ref>Charnia, Eugene: ''Introduction to artificial intelligence'', page 2. Addison-Wesley, 1984.</ref> प्राकृतिक भाषा संसाधन, कम्प्यूटर के द्वारा, मानव द्वारा कही या लिखी भाषा से अर्थ निकालने का काम करता है। इसके अलावा प्राकृतिक भाषा का सृजन (लिखित या वाचित रूप में) करने के लिए भी एनएलपी प्रयुक्त होता है।


==चुनौती==
==चुनौती==
पंक्ति 8: पंक्ति 8:


==प्रक्रिया==
==प्रक्रिया==
* मार्फोलोजिक विश्लेषण
# मार्फोलोजिक विश्लेषण
* सिन्टैक्टिकल विश्लेषण
# सिन्टैक्टिकल विश्लेषण
* सिमैन्टिक विश्लेषण
# सिमैन्टिक विश्लेषण
* प्रैग्मटिक विश्लेषण - सन्दर्भ आदि का ध्यान रखना
# प्रैग्मटिक विश्लेषण - सन्दर्भ आदि का ध्यान रखना
* वाक्य की योजना बनाना
# वाक्य की योजना बनाना
* वाक्यनिर्माण
# वाक्यनिर्माण


==प्रमुख अनुप्रयोग==
==प्रमुख अनुप्रयोग==
पंक्ति 29: पंक्ति 29:


==इन्हें भी देखें==
==इन्हें भी देखें==
*[[वाक् संश्लेषण]]
*[[भाषा संगणन]]


==सन्दर्भ==
==सन्दर्भ==

06:36, 4 मार्च 2014 का अवतरण

प्राकृतिक भाषा संसाधन (एनएलपी) कम्प्यूटर विज्ञान, कृत्रिम बुद्धि तथा भाषा विज्ञान का एक क्षेत्र है तथा मानव (प्राकृतिक) भाषाओं और कंप्यूटर के अन्तःक्रियाओं से सम्बन्धित है। [1] प्राकृतिक भाषा संसाधन, कम्प्यूटर के द्वारा, मानव द्वारा कही या लिखी भाषा से अर्थ निकालने का काम करता है। इसके अलावा प्राकृतिक भाषा का सृजन (लिखित या वाचित रूप में) करने के लिए भी एनएलपी प्रयुक्त होता है।

चुनौती

कम्प्यूटर द्वारा प्राकृतिक भाषा संसाधन करने में प्रमुख कठिनाइयाँ हैं-

  1. संदिग्धता
  2. शब्दों के आरम्भ और अन्त का सही पता लगाने की समस्या - बोली गयी भाषा में प्रायः शब्दों की सीमा का थीक-ठीक निर्धारण करना कठिन होता है। कुछ लिखित भाषाओं (जैसे मन्दारिन) में शब्दों के बीच जगह नहीं छोड़ी जाती जिससे शब्दों की सीमा का ठीक से पता करना और उन्हें अलग करना कठिन है।
  3. गलत आंकड़े - इसके अलावा शब्दों के टंकण की गलती, गलत वर्तनी, गलत उच्चारण, ओसीआर से प्राप्त टेक्स्ट में गलती आदि से भी सही शब्दों का पता नहीं चल पाता।

प्रक्रिया

  1. मार्फोलोजिक विश्लेषण
  2. सिन्टैक्टिकल विश्लेषण
  3. सिमैन्टिक विश्लेषण
  4. प्रैग्मटिक विश्लेषण - सन्दर्भ आदि का ध्यान रखना
  5. वाक्य की योजना बनाना
  6. वाक्यनिर्माण

प्रमुख अनुप्रयोग

कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-  

  1. मशीनी अनुवाद
  2. पाठ सरलीकरण
  3. सूचना निष्कर्षण (इन्फार्मेशन इक्सट्रैक्सन)
  4. सारांशीकरण (summerization)
  5. प्रश्नों के उत्तर देना
  6. संगणकीय भाषाविज्ञान
  7. डाटा खनन (डेटा माइनिंग)
  8. प्राकृतिक भाषा को समझना
  9. अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष

इन्हें भी देखें

सन्दर्भ

  1. Charnia, Eugene: Introduction to artificial intelligence, page 2. Addison-Wesley, 1984.