भाषा तकनीकी

मुक्त ज्ञानकोश विकिपीडिया से

भाषा तकनीकें (Language technologies) ऐसी सूचना तकनीक हैं जो मानव भाषा के प्रसंस्करण में प्रयुक्त होतीं हैं। मानव भाषा विश्व में सबसे जटिल व सबसे पुराना सूचना का माध्यम है।

मानव भाषा का अस्तित्व दो रूपों में है - भाषिक (बोली गयी) एवं लिखित। यद्यपि बोली, भाषा का सबसे पुरानी एवं सबसे सहज रूप है किन्तु जटिल सूचनायें एवं मानव ज्ञान का अधिकांश भाग लिखित भाषा के रूप में ही विद्यमान है तथा इसका संचार भी लिखित रूप में ही अधिक होता है। स्पीच तकनीक एवं टेक्स्ट तकनीकें भाषा को इन दो रूपों में प्रकलन (प्रोसेसिंग) करती है। किन्तु स्पीच एवं टेक्ट तकनीकें ही पर्याप्त नहीं हैं। इसलिये बहुत सी भाषा तकनीकें ऐसी भी हैं जो स्पीच या टेक्स्ट की प्रोसेसिंग करने के बजाय भाषा को ज्ञान से जोडने में सहायक होतीं हैं।

भाषा तकनीकें भविष्य में बहुत महत्वपूर्ण होगीं। इनके विकसित होने के बाद अनेक कार्यों के करने के तरीके में विस्मयकारी परिवर्तन आने वाला है।

भाषा तकनीकियाँ[संपादित करें]

भाषण को समझना / भाषण से टेक्स्ट में परिवर्तन (Speech recognition)

भाषण की रचना (Speech synthesis)

टेक्स्ट का वर्गीकरण (Text categorization)

टेक्स्ट सारांशक (Text Summarization)

Text Indexing

Text Retrieval

सूचना निकालना (Information Extraction)

Data Fusion and Text Data Mining

जिज्ञासा समाधान (Question Answering)

रिपोर्ट सृजन (Report Generation)

Spoken Dialogue Systems

अनुवाद की तकनीकें[संपादित करें]

Nondiscrete Mathematical Methods

Statistical techniques

Logical and Linguistic Formalisms

भाषायी ज्ञान[संपादित करें]

शब्दकोश

morphological syntactic grammars

rules for semantic interpretation

उच्चारण एवं इन्टोनेशन (intonation.)

Corpora and Corpus Tools

विविध[संपादित करें]

Voice Control Systems

Dictation Systems

Text-to-Speech Systems

Machine Initiative Spoken Dialogue Systems

Identification and Verification Systems

Spoken Information Access

Mixed Initiative Spoken Dialogue Systems

Speech Translation Systems

Spell Checkers

Machine-Assisted Human Translation

Translation Memories

Indicative Machine Translation

Grammar Checkers

Information Extraction

Human Assisted Machine Translation

Report Generation

High Quality Text Translation

Text Generation Systems

Word-Based Information Retrieval

Summarization by Simple Condensation

Simple Statistical Categorization

Simple Automatic Hyperlinking

Cross-Lingual Information Retrieval

Automatic Hyperlinking With Disambiguation

Simple Information Extraction (Unary, Binary Relations)

Complex Information Extraction (Ternary+ Relations)

Dense Associative Hyperlinking

Concept-Based Information Retrieval

Text Understanding

इन्हें भी देखें[संपादित करें]

बाहरी कड़ियाँ[संपादित करें]