सामग्री पर जाएँ

मशीनी लिप्यन्तरण

मुक्त ज्ञानकोश विकिपीडिया से

कम्प्यूटर सॉफ्टवेयर की सहायता से एक भाषा या लिपि के शब्दों का किसी दूसरी भाषा या लिपि में ध्वन्यात्मक (फोनेटिक) परिवर्तन मशीनी लिप्यन्तरण (मशीन ट्रान्सलिटरेशन) कहलाता है। John को देवनागरी/हिन्दी में जॉन लिखना लिप्यन्तरण का एक उदाहरण है।

  • कम्प्यूटर के इस युग में मशीनी अनुवाद के साथ-साथ मशीनी लिप्यन्तरण आजकल बहुत उपयोगी हो गया है। मशीनी अनुवाद करते समय जिन शब्दों के तुल्य शब्द मशीन के शब्दकोश में नहीं मिलते (Out of vocabulary words) उनको कुछ नियमों का पालन करते हुए केवल लिप्यन्तरित कर दिया जाता है। अधिकतर लिप्यन्तरण सेवाएँ वेब आधारित हैं।
  • नामवाचक संज्ञाओं (प्रॉपर नाउन्स) का लिप्यन्तरण ही करना पड़ता है। जैसे Mc Donald को मैक डोनाल्ड लिखना पड़ता है।
  • कुछ तकनीकी शब्दों का अनुवाद करने के बजाय उन्हें केवल लिप्यन्तरित करना बेहतर माना जाता है। जैसे transistor को ट्रान्जिस्टर लिखना अधिक उचित होगा न कि transistor लिखना।
  • भारतीय भाषाओं में अधिकांश शब्द समान हैं किन्तु भिन्न लिपि में लिखे होने के कारण उन्हें पढकर समझना/सीखना कठिन होता है। इनका केवल लिप्यन्तरण कर देने से दूसरी भारतीय भाषा समझने व सीखने में बहुत अधिक सुविधा मिल जाती है।
  • लिप्यंतरण से दो भाषाओं के मध्य एक सेतु का निर्माण हो जाता है, जिससे दूसरी भाषा की लिपि नहीं जानने वाले लोग भी उस भाषा को समझ सकते हैं ।

मशीनी लिप्यन्तरण की विधियाँ

[संपादित करें]
  • 1) ध्वन्यात्मक प्रतिरूपण (फोनीनिक मैपिंग)
  • 2) शब्दकोश में शब्दयुग्म देखकर
  • 3) मशीन शिक्षण द्वारा (मशीन लर्निंग बेस्ड)
  • 4) नियमाधारित (रूल-बेस्ड)

विभिन्न भारतीय भाषी लिप्यन्तरण सेवाएँ

[संपादित करें]

भारतीय भाषाऔं में लिप्यन्तरण सेवा सर्वप्रथम लॅटिन कीबोर्ड से विभिन्न लिपियौं मे "ध्वन्यात्मक" कीकोड के रूप में विकास हुआ (उदाहरण "ka" दबाने पर "क" टाइप होना)। इस प्रकार के लिप्यन्तरण का विकास भारतीय युनिकोड से पूर्व ही हो चुका था। यह विकास प्राथमिक रूप में लैटिन कीबोर्ड से भारतीय ट्रेडिसनल फॉण्ट के सरल एण्ट्री के निमित्त विकसित हुआ था। भारतीय लिपियौं में अन्तर-लिप्यन्तरण इस के बाद विकसित हुआ।

सर्वप्रथम भारतीय यान्त्रिक लिप्यन्तरण का विकास किस ने किया था, इस के बारे में आधिकारिक तथ्य उपलब्ध नहीं है। परन्तु अन्तरजाल के फैलाव व भारतीय युनिकोड के विकास के बाद भारतीय यान्त्रिक लिप्यन्तरण में एक प्रकार का उर्जा निर्माण कर दिया।

अन्तर-भारतीय भाषाओं के मशीनी लिप्यन्तरण में कन्नड-प्रमुख बरह सॉफ्टवॅर नें युनिकोड सहित विभिन्न ट्रेडिसनल फन्ट में यान्त्रिक लिप्यन्तरण का सुबिधा उपलब्ध किया है। खुला स्रोत के आलोक कुमार द्वारा विभिन्न भारतीय भाषाओं के मध्य टैक्स्ट के लिप्यंतरण के लिए गिरगिट नाम से तन्त्र बनाया गया था जो बहुत प्रसिद्ध रहा। इसके पश्चात पीयूष भट्ट जी द्वारा भोमियो नामक वेबसाइट बनायी गयी जो कि किसी वेबपेज के लिपि को रियल टाइम में बदल कर दिखाता था। यह सेवा हिन्दी चिट्ठाकारों में काफी लोकप्रिय हुई। परन्तु कुछ समय बाद यह सेवा बन्द हो गई। इसके पश्चात आलोक कुमार तथा डॉ विपुल जैन ने गिरगिट का नया संस्करण बनाया जो कि टैक्स्ट के अतिरिक्त वेबपेज की लिपि भी बदल कर दिखा सकता है। नवम्बर 2009 में गूगल ने भी विभिन्न भारतीय भाषाओं के मध्य लिप्यन्तरण सेवा का आरम्भ किया जिसमें कि कई लिपियाँ सम्मिलित हैं।

बाहरी कड़ियाँ

[संपादित करें]
  • MACHINE TRANSLITERATION IN JAVA - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) के बारे में विस्तृत विचार किया गया है और एक आनलाइन लिप्यन्तरण प्रोग्राम भी है।

लिप्यंतरण यन्त्र

[संपादित करें]
  • Sanskripta - देवनागरी एवं अन्य भारतीय भाषाओं का परस्पर लिप्यन्तरण का आनलाइन प्रोग्राम। यहाँ भारतीय भाषाओं और आईट्रन्स/हार्वर्ड-क्योटो आदि को भी परस्पर बदलने की सुविधा है।
  • गिरगिट - यूनिकोडित उड़िया, कन्नड़, गुजराती, गुरमुखी, तमिल, तेलुगु, बांग्ला या मलयालम का परस्पर लिपि परिवर्तक प्रोग्राम
  • SCSS, JNU का Indian Language Transliterator
  • Unicode Transliteration Test Page
  • Turn your text into fənɛ́tɪks (IPA / American)
  • NHM Indic Transliterator 1.0.10[मृत कड़ियाँ] - इस फायरफॉक्स एक्स्टेंशन के सहारे देवनागरी, तमिल, तेलुगू, मलयालम, कन्नड आदि लिपियों में लिखे किसी वेबसाइट को एक क्लिक में इनमें से ही किसी दूसरी लिपि में बदल कर देखा जा सकता है।
  • Padma: Transformer for Indic Scripts, How to write a Padma conversion file?
  • सिर्पी - तमिल से विभिन्न लिपियौं में लिप्यन्तरण
  • जावा लिप्यंतरण - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) सम्भव है। (फायरफॉक्स में नही चलता ; 27-04-2010)
  • IL Transliteration (Many scripts)