सामग्री पर जाएँ

हिन्दी-उर्दू लिप्यंतरण

मुक्त ज्ञानकोश विकिपीडिया से

हिन्दी–उर्दू (देवनागरी लिपि: हिन्दी-उर्दू, नस्तालीक़ लिपि: ہندی-اردو), जिसे आमतौर पर हिन्दुस्तानी भी कहा जाता है,[1][2] आधुनिक उत्तर भारत और पाकिस्तान की व्यवहार्य सम्पर्क भाषा है, जिन्हें पारंपरिक रूप से एकत्रित रूप से हिन्दुस्तान कहा गया है।[3] आधुनिक मानक हिन्दी औपचारिक रूप से भारत में देवनागरी लिपि में लिखने के मानक के रूप में पंजीकृत है, और मानक उर्दू औपचारिक रूप से पाकिस्तान में विस्तारित फ़ारसी-अरबी लिपि में लिखने के मानक के रूप में पंजीकृत है।

हिन्दी–उर्दू लिप्यंतरण (या हिन्दुस्तानी लिप्यंतरण) वह प्रक्रिया है जिसके द्वारा देवनागरी में लिखित पाठ (हिन्दी के लिए प्रयुक्त) को फ़ारसी-अरबी लिपि (उर्दू के लिए प्रयुक्त) में या उसके विपरीत परिवर्तित किया जाता है। इसका मुख्य उद्देश्य उन समान ध्वनियों का प्रतिनिधित्व करना है जो इन लिपियों के बीच साझा हैं, अथवा उनकी जगह अन्य लिपियों का, विशेषकर लातिन वर्णमाला का उपयोग करते हुए लेखन प्रस्तुत करना है।[4] सैद्धान्तिक रूप से लिप्यंतरण संभव है क्योंकि हिन्दी-उर्दू के पीछे समान हिन्दुस्तानी ध्वन्यात्मक प्रणाली विद्यमान है। आजकल हिन्दुस्तानी भाषा को एक एकीकृत भाषा के रूप में देखा जाता है,[5] जैसा कि महात्मा गांधी ने हिन्दी–उर्दू विवाद के समाधान हेतु मूल रूप से प्रस्तावित किया था।[6][7]


तकनीकी रूप में, हिन्दी-उर्दू का एक-से-एक लिप्यंतर या नियम-आधारित बिना हानि वाला लिप्यंतरण सीधे लागू करना संभव नहीं है। इसका मुख्य कारण यह है कि हिन्दी एक आबूगीदा लिपि में लिखी जाती है जबकि उर्दू एक अब्जद लिपि में लिखी जाती है; साथ ही फ़ारसी-अरबी की कुछ समान अक्षर देवनागरी में एक ही अक्षर पर मानचित्रित हो जाते हैं।[8] तथापि, शब्दकोश-आधारित मानचित्रण के प्रयास हुए हैं जिनसे अत्यधिक शुद्धता प्राप्त हुई है और लगभग-परिपूर्ण लिप्यंतरण हासिल किए गए हैं।[9] साहित्यिक क्षेत्रों में केवल प्रतिलिप्यांक पर्याप्त नहीं रहता क्योंकि औपचारिक हिन्दी संस्कृत शब्दावली की ओर झुकाव रखती है जबकि औपचारिक उर्दू फ़ारसी तथा अरबी शब्दावली की ओर झुकाव रखती है; अतः उन मामलों के लिए लिप्यंतरण और अनुवाद का संयुक्त तंत्र आवश्यक होगा।[10]

हिन्दी–उर्दू के अतिरिक्त, द्विलिप्यकीय भाषाओं के लिए इंडो-पाकिस्तानी लिप्यंतरण प्रणालियाँ बनाये जाने के प्रयास भी हुए हैं, जैसे कि सिन्धी (जो पाकिस्तान के सिन्ध प्रान्त में विस्तारित फ़ारसी-अरबी में तथा विभाजन-उपरांत भारत में देवनागरी में लिखी जाती है), पंजाबी (पूर्वी पंजाब में गुरुमुखी और पश्चिमी पंजाब में शाहमुखी), सरायकी (सरायिकिस्तान में विस्तारित शाहमुखी और भारत में अनौपचारिक रूप से सिन्धी-देवनागरी में) और कश्मीरी (कश्मीरी मुसलमानों द्वारा विस्तारित फ़ारसी-अरबी में और कश्मीरी हिन्दुओं द्वारा विस्तारित देवनागरी में)।[11][12][13]

हिंदुस्तानी स्वर
अन्तर्राष्ट्रीय ध्वन्यात्मक वर्णमाला

(अ॰ध॰व॰)

अंतरराष्ट्रीय मानकीकरण संगठन १५९१९ हिन्दी उर्दू[14] अंग्रेज़ी में लगभग समकक्ष (उदाहरण)
स्वतंत्र स्वर व्यंजनों पर आलोचना अंतिम माध्यिका प्रारंभिक
ə[15] a [16] ـہ ـا ـ◌َـ اَ about
ā ـا آ far
ɪ i ि ـی ـ◌ِـ اِ still
ī ◌ِـیـ اِیـ fee
ʊ u ـو ـ◌ُـ اُ book
ū ◌ُـو اُو moon
ē ے ـیـ ایـ hair
ɛː ai ◌َـے ◌َـیـ اَیـ fairy
ō ـو او force
ɔː[उद्धरण चाहिए] au ◌َـو اَو lot
ʰ[17] h ھ cake
◌̃[18] ں ـن٘ـ ن٘ faun
jungle

स्वरसूचक

[संपादित करें]

हिन्दुस्तानी में अपनी पूर्ण-वर्णमाला में व्यंजनों का एक समृद्ध समूह है, क्योंकि इसमें एक मिश्रित-शब्दावली (पुरानी हिन्दी से व्युत्पन्न) (देहलवी से) फ़ारसी (पहलवी से) और अरबी भाषाओं के उधार शब्दों के साथ, जो सभी क्रमशः ३ अलग-अलग भाषा-परिवारों से हैंः हिन्द-आर्यन, ईरानी और सामी

निम्नलिखित तालिका हिन्दी-उर्दू व्यंजनों के लिए एक-से-एक मानचित्रण प्रदान करती है, विशेष रूप से संगणनात्मक उद्देश्यों के लिए (हानि रहित लिपि रूपांतरण)।[19] ध्यान दें कि इस प्रत्यक्ष लिपि रूपांतरण से सही वर्तनी नहीं मिलेगी,[20] बल्कि दोनों पाठकों के लिए एक पठनीय पाठ होगा।[21] ध्यान दें कि हिन्दू-उर्दू लिप्यंतरण योजनाओं का उपयोग पंजाबी के लिए भी किया जा सकता है, गुरुमुखी (पूर्वी पंजाबी से शाहमुखी (पश्चिमी पंजाबी) रूपांतरण के लिए, क्योंकि शाहमुखी उर्दू वर्णमाला का एक सुपरसेट है (२ अतिरिक्त व्यंजनों के साथ) और गुरुमुखी लिपि को सरल से देवनागरी लिपि में परिवर्तित किया जा सकता हैं। इसके अलावा एक फोर्ट विलियम कॉलेज प्रलेख ने हिन्दुस्तानी की 'ع' ध्वनि के बराबर दिखाया है।[22]

हिन्दुस्तानी स्वर
फ़ारसी-अरबी लातिन देवनागरी टिप्पणियाँ
ک k
کھ kh
ق q क़ नुक़्ता वाले अक्षर को बोलचाल में कभी-कभी अनदेखा कर के साधारण 'क' ही लिखा जाता है।[23][24]
خ k͟h ख़ नुक़्ता वाले अक्षर को बोलचाल में कभी-कभी अनदेखा कर के साधारण 'ख' ही लिखा जाता है।[23][24]
گ g
غ ġ ग़ नुक़्ता वाले अक्षर को बोलचाल में कभी-कभी अनदेखा कर के साधारण 'ग' ही लिखा जाता है।[23][24]
گھ gh
چ c
چھ ch
ج j
جھ jh
ز z ज़ नुक़्ता वाले रूप; यह ध्वनि देवनागरी में ज से मेल खाती है।[23][24]
ذ ज़ ज़ ध्वनि के समान, पर उर्दू में व्युत्पत्ति कारणों से अलग वर्तनी।
ض ż ज़ ज़ ध्वनि के समान, पर उर्दू में व्युत्पत्ति कारणों से अलग वर्तनी।
ظ ज़ ज़ ध्वनि के समान, पर उर्दू में व्युत्पत्ति कारणों से अलग वर्तनी।
ژ ž झ़ फ़ारसी से सीधे लिये शब्दों में प्रयुक्त।
ٹ
ٹھ ṭh
ڈ
ڈھ ḍh
ڑ ड़ बोलचाल में ṛ और ḍ में भ्रम होता है।
ڑھ ṛh ढ़ बोलचाल में ṛh और ḍh में भ्रम होता है।
ت t
تھ th
ط ध्वनि त के समान; उर्दू में व्युत्पत्तिगत वर्तनी के कारण अलग अक्षर।
د d
دھ dh
ن n
پ p
پھ ph
ف f फ़ नुक़्ता वाला फ; बोलचाल में कभी-कभी साधारण 'फ' लिखा जाता है।[23][24]
ب b
بھ bh
م m
ی y
ر r
ل l
و v ओ अरबी शब्दों के लिए/w/और इंडो-ईरानी शब्दों के लिए
w व़
ش ś
س s
ص (वही ध्वनि एस के रूप में, व्युत्पत्ति संबंधी कारणों से उर्दू में अलग-अलग वर्तनी
ث (वही ध्वनि एस के रूप में, व्युत्पत्ति संबंधी कारणों से उर्दू में अलग-अलग वर्तनी
ہ h
ح ह के समान ध्वनि; उर्दू में व्युत्पत्तिगत वर्तनी।
ۃ ह के समान, कभी-कभी मौन रहता है; उर्दू में विशेष रूप।
ھ h ્ह सामान्यतः केवल अस्पिरेटेड व्यंजनों के साथ प्रयुक्त; अकेले उपयोग त्रुटिपूर्ण माना जा सकता है और इसे ہ समझा जाता है।
ع a' अ़ कभी-कभी ग्लोटल स्टॉप के समान; कभी मौन रहता है।

संस्कृत व्यंजन

[संपादित करें]

निम्नलिखित व्यंजनों का उपयोग ज़्यादातर उन शब्दों में किया जाता है जो सीधे संस्कृत से उधार लिए गए हैं या अनुकूलित किए गए हैं।

फ़ारसी-अरबी लातिन देवनागरी टिप्पणियाँ
ن٘
ݩ ñ ݩ गोजरी लिखने के लिए पेश किया गया था [25]
ݨ ݨ शाहमुखी लिखने के लिए पेश किया गया था [25]
لؕ शाहमुखी में इतना उपयोग नहीं
ݜ ݜ शीना लिखने के लिए पेश किया गया था [25]
ڔّ

अंतःस्फोटी उच्चारण

[संपादित करें]

ये व्यंजन ज़्यादातर सिन्धी और सराइकी जैसी भाषाओं में ही पाए जाते हैं।

फ़ारसी-अरबी लातिन देवनागरी
ڳ
ڄ
ݙ/ڏ
ٻ ॿ
उपयोग संख्या प्रणाली अंक
उर्दू पूर्वी-अरबी ۰ ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹
अन्तर्राष्ट्रीय हिन्दू-अरबी 0 1 2 3 4 5 6 7 8 9
हिन्दी आधुनिक देवनागरी

विराम चिह्न और प्रतीक

[संपादित करें]
स्क्रिप्ट अवधि प्रश्न चिह्न कॉमा अर्ध-कोलन स्लैश प्रतिशत पद्य का अंत
फ़ारसी-अरबी ۔ ؟ ، ؛ ؍ ٪ ۝
आधुनिक देवनागरी ? , ; / %

नमूना पाठ

[संपादित करें]

निम्नलिखित अंश मुहम्मद इक़बाल द्वारा लिखित हिन्दुस्तानी कविता तराना-ए-हिंदी (सारे जहाँ से अच्छा) का एक भाग है।

फ़ारसी-अरबी देवनागरी लातिन अंग्रेज़ी अनुवाद
سَارے جَہَاں سے اَچّھَا،
ہِنْدُوسِتَاں ہَمَارَا۔
ہَمْ بُلْبُلیں ہَیں اِسْکِی،
یَہْ گُلْسِتَاں ہَمَارَا۔۔
सारे जहाँ से अच्छा,

हिन्दुसिताँ हमारा। हम बुलबुलें हैं इसकी, यह गुलसिताँ हमारा॥

sāre jahā̃ se acchā,

hindusitā̃ hamārā. ham bulbulẽ ha͠i iskī, yah gulsitā̃ hamārā..

Better than the entire world,

is our India. We are its nightingales, and it (is) our garden abode.

यह भी देखें

[संपादित करें]

सन्दर्भ

[संपादित करें]
  1. "About Hindi-Urdu". North Carolina State University. मूल से से 15 अगस्त 2009 को पुरालेखित।. अभिगमन तिथि: 9 अगस्त 2009.
  2. Ray, Aniruddha (2011). The Varied Facets of History: Essays in Honour of Aniruddha Ray (अंग्रेज़ी भाषा में). Primus Books. ISBN 978-93-80607-16-0. There was the Hindustani Dictionary of Fallon published in 1879; and two years later (1881), John J. Platts produced his Dictionary of Urdu, Classical Hindi and English, which implied that Hindi and Urdu were literary forms of a single language. More recently, Christopher R. King in his One Language, Two Scripts (1994) has presented the late history of the single spoken language in two forms, with the clarity and detail that the subject deserves.
  3. Ashmore, Harry S. (1961). Encyclopaedia Britannica: a new survey of universal knowledge, Volume 11 (अंग्रेज़ी भाषा में). Encyclopædia Britannica. p. 579. The everyday speech of well over 50,000,000 persons of all communities in the north of India and in West Pakistan is the expression of a common language, Hindustani.
  4. Lehal, Gurpreet Singh; Saini, Tejinder Singh (December 2012). "Development of a Complete Urdu-Hindi Transliteration System". Proceedings of COLING 2012: Posters. Mumbai, India: The COLING 2012 Organizing Committee: 643–652.
  5. David Lunn, Dawn com (28 January 2019). "Urdu and Hindi could be one language called Hindustani. Will the politics of language allow it?". Scroll.in (अमेरिकी अंग्रेज़ी भाषा में). अभिगमन तिथि: 2021-04-08.
  6. David Lunn, Dawn com (28 January 2019). "Urdu and Hindi could be one language called Hindustani. Will the politics of language allow it?". Scroll.in (अमेरिकी अंग्रेज़ी भाषा में). अभिगमन तिथि: 2021-04-08.
  7. "After experiments with Hindi as national language, how Gandhi changed his mind". Prabhu Mallikarjunan. The Feral. 3 October 2019.
  8. Visweswariah, Karthik; Chenthamarakshan, Vijil; Kambhatla, Nandakishore (August 2010). "Urdu and Hindi: Translation and sharing of linguistic resources". Coling 2010: Posters. Coling 2010 Organizing Committee: 1283–1291.[मृत कड़ियाँ]
  9. Lehal, Gurpreet Singh; Saini, Tejinder Singh (2010). "A Hindi to Urdu Transliteration System" (PDF). {{cite journal}}: Cite journal requires |journal= (help)
  10. Durrani, Nadir; Sajjad, Hassan; Fraser, Alexander; Schmid, Helmut (July 2010). "Hindi-to-Urdu Machine Translation through Transliteration". Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. Uppsala, Sweden: Association for Computational Linguistics: 465–474.
  11. "Perso-Arabic To Indic Script Transliteration". sangam.learnpunjabi.org. अभिगमन तिथि: 2021-04-07.
  12. "Saraiki - Devanagari Machine Transliteration System - SDMTS". www.sanlp.org. मूल से से 23 अक्तूबर 2021 को पुरालेखित।. अभिगमन तिथि: 2021-08-09.
  13. Lawaye, Aadil; Kak, Aadil; Mehdi, Nali (January 2010). "Building a Cross Script Kashmiri Converter: Issues and Solutions". Proceedings of Oriental COCOSDA.
  14. Diacritics in Urdu are normally not written and usually implied and interpreted based on the context of the sentence
  15. [ɛ] occurs as a conditioned allophone of /ə/ near an /ɦ/ surrounded on both sides by schwas. Usually, the second schwa undergoes syncopation, and the resultant is just an [ɛ] preceding an /ɦ/.
  16. Hindi does not have a diacritic to represent ə as it is usually implied after unmarked consonants.
  17. Hindi has individual letters for aspirated consonants whereas Urdu has a specific letter to represent an aspirated consonant
  18. No words in Hindustani can begin with a nasalised letter/diacritic. In Urdu the initial form (letter) for representing a nasalised word is: ن٘ (nūn + small nūn ghunna diacritic)
  19. NC, Gokul (2021-05-07), GokulNC/Indic-PersoArabic-Script-Converter, अभिगमन तिथि: 2021-05-28
  20. Ahmed, Nisar. "An efficient Hindi-Urdu Transliteration System" (PDF). 5th International. Multidisciplinary Conference, 29-31 Oct., at, ICBS, Lahore. मूल से (PDF) से 22 अप्रैल 2021 को पुरालेखित।. अभिगमन तिथि: 2 सितंबर 2025.
  21. Ahmed, Nisar. "An efficient Hindi-Urdu Transliteration System" (PDF). 5th International. Multidisciplinary Conference, 29-31 Oct., at, ICBS, Lahore. मूल से (PDF) से 22 अप्रैल 2021 को पुरालेखित।. अभिगमन तिथि: 2 सितंबर 2025.
  22. Primitiae Orientales Vol. II (अंग्रेज़ी भाषा में). Al Hindiyyah Al Bartaniyyah: Fort William College. 1803. p. 51.
  23. 1 2 3 4 5 Shapiro, Michael C. (1989). A Primer of Modern Standard Hindi (English भाषा में). Motilal Banarsidass Publ. p. 20. ISBN 978-81-208-0508-8. In addition to the basic consonantal sounds discussed in sections 3.1 and 3.2, many speakers use any or all five additional consonants (क़ , ख़ ḳh,ग़ ġ, ज़ z, फ़ f) in words of foreign origin (primarily from Persian, Arabic, English, and Portuguese). The last two of these, ज़ z and फ़ f, are the initial sounds in English zig and fig respectively. The consonant क़ is a voiceless uvular stop, somewhat like k, but pronounced further back in the mouth. ख़ ḳh is a voiceless fricative similar in pronunciation to the final sound of the German ach. ग़ ġ is generally pronounced as a voiceless uvular fricative, although it is occasionally heard as a stop rather than a fricative. In devanāgari each of these five sounds is represented by the use of a subscript dot under one of the basic consonant signs. In practice, however, the dot is often omitted, leaving it to the reader to render the correct pronunciation on the basis of his prior knowledge of the language.{{cite book}}: CS1 maint: unrecognized language (link)
  24. 1 2 3 4 5 Pandey, Dipti; Mondal, Tapabrata; Agrawal, S. S.; Bangalore, Srinivas (2013). "Development and suitability of Indian languages speech database for building watson based ASR system". 2013 International Conference Oriental COCOSDA held jointly with 2013 Conference on Asian Spoken Language Research and Evaluation (O-COCOSDA/CASLRE). p. 3. डीओआई:10.1109/ICSDA.2013.6709861. ISBN 978-1-4799-2378-6. Only in Hindi 10 Phonemes व /v/ क़ /q/ ञ /ɲ/ य /j/ ष /ʂ/ ख़ /x/ ग़ /ɣ/ ज़ /z/ झ़ /ʒ/ फ़ /f/
  25. 1 2 3 "Proposal for extensions to the Arabic block" (PDF).