"एच.टी.एम.एल.": अवतरणों में अंतर
छो Bot: अंगराग परिवर्तन |
छो r2.7.3) (रोबॉट: ur:وراۓمتن زبان تدوین की जगह ur:ورائےمتن زبان تدوین जोड़ रहा है |
||
पंक्ति 460: | पंक्ति 460: | ||
[[tr:HTML]] |
[[tr:HTML]] |
||
[[uk:HTML]] |
[[uk:HTML]] |
||
[[ur: |
[[ur:ورائےمتن زبان تدوین]] |
||
[[uz:HTML]] |
[[uz:HTML]] |
||
[[vi:HTML]] |
[[vi:HTML]] |
16:22, 12 फ़रवरी 2013 का अवतरण
संचिकानाम विस्तार |
.html, .htm |
---|---|
इंटरनेट मीडिया प्रकार |
text/html |
प्रकार कोड | TEXT |
युनीफ‘ओर्म प्रकार आइडेन्टिफायर | public.html |
द्वारा विकसित | World Wide Web Consortium & WHATWG |
फॉर्मैट का प्रकार | Markup language |
से विस्तृत | SGML |
को विस्तृत | XHTML |
मानक | W3C HTML 3.2 |
HTML (अंग्रेज़ी: Hypertext Markup Language) जिसका पूरा नाम हाइपरटेक्स्ट मार्कअप लैंग्वेज है, वेब पेजों के निर्माण के लिए प्रमुख मार्कअप भाषा है शीर्षक, अनुच्छेद, सूची आदि जैसे पाठ्य एवं साथ ही लिंक, उद्धरण तथा अन्य मदों के लिए भी, संरचनात्मक शब्दार्थ बता कर संरचित दस्तावेज तैयार करने के लिए यह एक ज़रिया प्रदान करती है. यह चित्रों और बिंबों को अनुमत करती है एवं इसका प्रयोग पारस्परिक क्रिया संबंधी प्रारूपों को तैयार करने के लिए किया जा सकता है. इसे वेब-पेज सामग्री के भीतर कोण कोष्ठकों से घिरे "टैग्स" युक्त HTML तत्वों के रूप में लिखा जाता है.यह जावास्क्रिप्ट जैसी भाषाओं के स्क्रिप्ट्स शामिल या लोड कर सकती है, जो पाठ्य और अन्य सामग्री के रूप और विन्यास को निरूपित करने के लिए वेब ब्राउजर और कास्केडिंग स्टाइल शीट्स(CSS) जैसे HTML प्रोसेसर के आचरण को प्रभावित करती है.सुस्पष्ट प्रतिपादक मार्कअप की तुलना में CSS के उपयोग को प्रोत्साहित किया गया है.
HTML का इतिहास
उद्गम
1981 में भौतिक विज्ञानी टिम बर्नर्स-ली ने, जो CERN में एक स्वतंत्र ठेकेदार थे, CERN शोधकर्ताओं के लिए दस्तावेजों के उपयोग और आपस में बांटने के लिए एक प्रणाली ENQUIRE को प्रस्तावित कर उसका नमूना तैयार किया. 1989 में बर्नर्स-ली और CERN डाटा सिस्टम के इंजीनियर रॉबर्ट कैलियाउ ने एक-सी कार्यात्मकता वाले इंटरनेट-आधारित हाइपरटेक्स्ट प्रणाली के लिए अलग-अलग प्रस्ताव पेश किए. अगले वर्ष, उन्होंने एक संयुक्त प्रस्ताव, WorldWideWeb(W3)[1] परियोजना पर एक साथ काम किया, जिसे CERN ने स्वीकार किया. 1990 के अपने व्यक्तिगत नोट्स[2] से "जिन कई क्षेत्रों में हाइपरटेक्स्ट का प्रयोग होता है, उनमें से कुछ को " सूचीबद्ध[3] किया, और एक विश्वकोश को पहले रखा.
प्रथम विनिर्देशन
HTML के बारे में सार्वजनिक रूप से उपलब्ध प्रथम विवरण HTML टैग नामक एक दस्तावेज़ था, जिसका उल्लेख 1991 के आखिर में इंटरनेट पर सबसे पहले बर्नर्स-ली द्वारा किया गया था.[4][5] इसमें प्रथमाक्षर, HTML की अपेक्षाकृत सरल डिजाईन को शामिल करते हुए 22 तत्वों का वर्णन है. इन तत्वों में से तेरह अभी भी HTML 4 में मौजूद हैं.[6] HTML, वेब पृष्ठों के गतिशील प्रारूपण के लिए, वेब ब्राउज़र द्वारा प्रयुक्त पाठ्य और चित्रों के संरूपण की भाषा है. इसके कई टैगों के शब्दार्थ विन्यास को, CTSS (कंम्पैटिबल टाइम-शेयरिंग सिस्टम) ऑपरेटिंग सिस्टम के लिए 1960 के प्रारंभ में विकसित किए गए RUNOFF कमांड द्वारा प्रयुक्त प्रारंभिक पाठ्य संरूपण भाषाओं से जोड़ा जा सकता है, और इसके संरूपण आदेश, टाइपसेट्टर द्वारा प्रलेखों को हाथ से प्रारूपित करने के लिए प्रयुक्त आदेशों से व्युत्पन्न हैं.
बर्नर्स-ली ने HTML को SGML का अनुप्रयोग माना, और 1993 के मध्य में इंटरनेट इंजीनियरिंग टास्क फोर्स (IETF) द्वारा बर्नर्स-ली और डैन कोन्नोल्ली के इंटरनेट-ड्राफ्ट, एक HTML विनिर्देशन: "हाइपरटेक्स्ट मार्कअप लैंग्वेज (HTML)" के लिए प्रथम प्रस्ताव के प्रकाशन के साथ औपचारिक रूप से इस रूप में परिभाषित किया गया था, जिसमें व्याकरण को परिभाषित करने के लिए एक SGML प्रलेख प्रकार परिभाषा शामिल थी.[7] ड्राफ्ट छह महीनों के बाद समाप्त हो गया, लेकिन IETF की सफल प्रोटोटाइप पर आधारित मानकों के तत्व-विचार को प्रतिबिंबित करते हुए, इन-लाइन चित्रों को शामिल करने के लिए NCSA मोज़ैक ब्राउज़र के कस्टम टैग की अभिस्वीकृति के लिए उल्लेखनीय रहा.[8] इसी प्रकार, 1993 के अंत में डेव राग्गेट के प्रतिस्पर्धी इंटरनेट-ड्राफ्ट, "HTML + (Hypertext markup format)", ने टेबल और फिल-आउट फॉर्म जैसी पहले से लागू सुविधाओं के मानकीकरण का सुझाव दिया.[9]
1994 की शुरूआत में HTML और HTML + ड्राफ्ट के समापन के बाद, IETF ने एक HTML कार्य समूह बनाया, जिसने 1995 में "HTML 2.0" को पूर्ण किया, जो कि मानक के रूप में व्यवहृत किए जाने के लिए अभिप्रेत प्रथम HTML विनिर्देशन था, जिस पर भावी कार्यान्वयन आधारित हो.[8] 1866 टिप्पणियों के लिए अनुरोध के रूप में प्रकाशित, HTML 2.0 में HTML एवं HTML+ ड्राफ्ट के विचार भी शामिल थे.[10] कोई "HTML 1.0" मौजूद नहीं था; 2.0 संकेत, पिछले ड्राफ्ट से नए संस्करण को अलग करने के लिए अभिप्रेत था.[11]
IETF के तत्वावधान में आगे का विकास प्रतिस्पर्धी हितों के कारण रुक गया था. 1996 के बाद से, विश्व व्यापी वेब संघ (W3C) ने, वाणिज्यिक सॉफ्टवेयर विक्रेताओं से निविष्टियों के साथ, HTML विनिर्देशों को संभाला है.[12] तथापि, 2000 में HTML भी एक अंतर्राष्ट्रीय मानक बन गया(ISO/IEC 15445:2000).W3C द्वारा प्रकाशित आखिरी HTML विनिर्देश, 1999 के अंत में प्रकाशित HTML 4.01 सिफ़ारिश था. आखिरी बार इसके मुद्दों और त्रुटियों को 2001 में प्रकाशित अशुद्धियों की सूची द्वारा अभिस्वीकृत किया गया था.
मानक का संस्करण इतिहास
HTML |
---|
HTML संस्करण समय-क्रम
- नवंबर 1995
- HTML 2.0 को IETF RFC 1866 के रूप में प्रकाशित किया गया था. पूरक RFCद्वारा जोड़ी क्षमताएं:
-
- नवंबर 1995: RFC 1867 (फॉर्म-आधारित फाइल अपलोड)
- मई 1996: RFC 1942 (टेबल्स)
- अगस्त 1996: RFC 1980 (क्लाइंट-साइड इमेज-मैप)
- जनवरी 1997: RFC 2070 (अंतर्राष्ट्रीयीकरण)
- जून 2000 में, RFC 2854 द्वारा इन सभी को अप्रचलित/ऐतिहासिक घोषित किया गया .
- जनवरी 1997
- HTML 3.2[13] को W3C की एक सिफारिश के रूप में प्रकाशित किया गया. यह विशेष रूप से W3C द्वारा मानकीकृत एवं विकसित पहला संस्करण था, क्योंकि IETF ने सितंबर 1997 में अपने HTML कार्य समूह को बंद कर दिया था.[14]
- HTML 3.2 ने गणित के फ़ार्मूलों को पूरी तरह से हटा कर, विभिन्न स्वाम्य एक्सटेंशनों के बीच अतिव्यापन को समंजित किया, और नेटस्केप के अधिकांश आभासी मार्कअप टैगों को अपना लिया. नेटस्केप के ब्लिंक एलिमेंट और माइक्रोसॉफ्ट के मार्की एलिमेंट को, दोनों कंपनियों के बीच एक आपसी समझौते की वजह से छोड़ दिया गया.[12] 14 महीने बाद MathML तक, गणितीय फ़ार्मुलों के लिए HTML के समान मार्कअप नहीं था.
- दिसंबर 1997
- HTML 4.0[15] को W3C सिफारिश के रूप में प्रकाशित किया गया था. यह तीन "फ़्लेवर्स" प्रस्तुत करता है:
-
- सख्त, जिसमें पदावनत तत्वों को वर्जित किया गया है.
- परिवर्ती, जिसमें पदावनत तत्वों की अनुमति है,
- फ्रेमसेट, जिसमें ज्यादातर केवल फ्रेम संबंधित तत्वों की अनुमति है;
- अप्रैल 1998
- संस्करण संख्या को न बढ़ाते हुए, HTML 4.0[17] को मामूली सुधारों के साथ दुबारा जारी किया गया.
- दिसंबर 1999
- HTML 4.01[18] को एक W3C सिफारिश के रूप में प्रकाशित किया गया. HTML 4.0 की तरह इसमें भी तीन प्रकार हैं, और आखिरी बार इसकी अशुद्धि-सूची 12 मई, 2001 को प्रकाशित की गई.
- मई 2000
- ISO/IEC 15445:2000[19] ("ISO HTML", HTML 4.01 स्ट्रिक्ट पर आधारित) को एक ISO/IEC अंतर्राष्ट्रीय मानक के रूप में प्रकाशित किया गया.
2008 के मध्य तक, HTML 4.01 और ISO/IEC 15445:2000, HTML के सबसे नए संस्करण हैं. XML-आधारित भाषा XHTML के सामानांतर विकास ने W3C के HTML कार्य समूह को २००० के प्रारंभ और मध्य में व्यस्त कर दिया.
ड्राफ़्ट
- अक्टूबर 1991
- HTML टैग्स ,[4] बारह HTML टैगों को सूचीबद्ध करने वाले एक अनौपचारिक CERN प्रलेख का सार्वजनिक तौर पर पहली बार उल्लेख किया गया. नवंबर 1992.
- जुलाई 1993
- हाइपरटेक्स्ट मार्कअप लैंग्वेज[20] को IETF द्वारा एक इंटरनेट-ड्राफ्ट (मानक के लिए एक कच्चे प्रस्ताव) के रूप में प्रकाशित किया गया. इसका समापन जनवरी 1994 में हुआ.
- नवंबर 1993
- HTML + को IETF द्वारा एक इंटरनेट-ड्राफ्ट के रूप में प्रकाशित किया गया और यह हाइपर टेक्स्ट मार्कअप लैंग्वेज ड्राफ्ट के लिए एक प्रतिस्पर्धी प्रस्ताव था. इसका समापन मई 1994 में हुआ.
- अप्रैल 1995 (मार्च 1995 में लिखित)
- HTML 3.0[21] को IETF के मानक के रूप में प्रस्तावित किया गया था, लेकिन बिना आगे की कार्रवाई के ही प्रस्ताव पांच महीने बाद समाप्त हो गया. इसमें रेग्गेट के HTML + प्रस्ताव के समान ही, टेबल के लिए समर्थन, आंकड़ों के आसपास पाठ्य का प्रवाह, और जटिल गणितीय फ़ार्मुलों के प्रदर्शन जैसी कई क्षमताएं शामिल थीं.[22]
W3C के अपने एरेना ब्राउज़र में एक निरूपण प्रदर्शित हुआ. कई कारणों से HTML 3.0 सफल नहीं हो पाया. ब्राउज़र विकास की गति, साथ ही इच्छुक पार्टियों की संख्या ने IETF के संसाधनों को पीछे छोड़ दिया था.[12] नवनिर्मित-W3C के लक्ष्यों के विपरीत, जिसने तार्किक संरचना के वर्णन तक HTML को सीमित करना चाहा था, नेटस्केप ने HTML के उन तत्वों को लागू करना जारी रखा, जिनमें प्रलेख का आभासी प्रदर्शन निर्दिष्ट था.[23][24] माइक्रोसॉफ्ट ने, जो उस समय नवागंतुक था, अपने स्वयं के टैग बना कर, संगतता के लिए नेटस्केप के तत्वों को लागू करते हुए और W3C के कास्केडिंग स्टाइल शीट जैसे लक्षणों को समर्थन देते हुए हर तरफ़ से व्यवहृत किया.[12]
हालांकि इसका सिंटेक्स SGML जैसा लगता है, पर HTML 5 ने SGML अप्लिकेशन की तरह दिखने का कोई प्रयास नहीं किया, और XML-आधारित XHTML 5 क्रमबद्धता के एक विकल्प के साथ अपने स्वयं की "HTML" क्रमबद्धता को स्पष्टतया परिभाषित किया.[26]
XHTML संस्करण
XHTML, एक अलग भाषा है, जिसकी शुरूआत XML 1.0 के प्रयोग द्वारा HTML 4.01 के पुनर्निर्माण के रूप में हुई. इसका विकास अभी जारी है:
- XHTML 1.0,[27] 26 जनवरी, 2000 को ३ की सिफ़ारिश के रूप में प्रकाशित हुई, और 1 अगस्त, 2002 को संशोधन के बाद पुनः प्रकाशित हुई. इसमें, मामूली प्रतिबंधों के साथ, XML में पुनर्निर्मित किए गए HTML 4.0 और 4.01 के जैसे ही तीन प्रकार हैं.
- XHTML 1.1,[28] 31 मई, 2001 को W3C सिफारिश के रूप में प्रकाशित हुई. यह XHTML 1.0 स्ट्रिक्ट पर आधारित है, पर इसमें मामूली परिवर्तन भी शामिल है, इसे अनुकूलित किया जा सकता है, और यह 10 अप्रैल, 2001 को W3C सिफारिश के रूप में प्रकाशित, XHTML के नियमन से मॉड्यूलों का उपयोग करके पुनर्निर्मित हुआ.
- XHTML 2.0,[29] अभी भी W3C कार्यकारी ड्राफ्ट है. W3C ने घोषणा की थी कि 2009 के अंत तक XHTML 2 समूह काम करना बंद कर देगा.[30] कोई XHTML 2.0 मानक नहीं होगा.XHTML 1.x के साथ XHTML 2.0 मेल जमता नहीं है, और इसलिए XHTML 1.x के अद्यतन की बजाय इसे XHTML-प्रेरित नवीन भाषा कहना ज्यादा सही होगा.
- XHTML5 को, जो XHTML 1.x का अद्यतन रूप है, अब HTML5 के साथ HTML5 ड्राफ्ट में परिभाषित किया जा रहा है.[31]
HTML मार्कअप
HTML मार्कअप में एलिमेंट्स (और उनके एट्रीब्यूट ), शब्द-आधारित डाटा प्रकार , और कैरेक्टर रेफ़रेन्स एवं एनटिटी रेफ़रेन्स सहित कई प्रमुख घटक शामिल हैं.डॉक्युमेंट टाइप डिक्लरेशन एक और महत्वपूर्ण घटक है, जो डॉक्युमेंट टाइप डेफ़िनिशन को निर्दिष्ट करता है. HTML 5 के अनुसार, किसी डॉक्युमेंट टाइप डेफ़िनिशन को निर्दिष्ट करने की जरूरत नहीं होगी एवं केवल ले-आउट मोड का निर्धारण होगा http://www.w3.org/2008/Talks/04-24-smith/index.html.
हैलो वर्ल्ड प्रोग्राम को, जो प्रोग्रामिंग भाषाओं, स्क्रिप्टिंग भाषाओं और मार्कअप भाषाओं की तुलना करने के लिए नियोजित एक आम कंप्यूटर प्रोग्राम है, HTML में 9 लाइनों के कोड से बनाया गया है, हालांकि लाइन ब्रेक वैकल्पिक हैं:
<!DOCTYPE html>
<html>
<head>
<title> Hello HTML </title>
</head>
<body>
<p>Hello World </p>
</body>
</html>
यह डॉक्युमेंट टाइप डिक्लरेशन HTML5 प्रारूप में है.
यदि <!DOCTYPE> डिक्लरेशन शामिल नहीं है, तो ले-आउट मोड अपने आप "quirks mode" हो जाता है.[32]
तत्त्व
- अधिक विस्तृत विवरणों के लिए देखें HTML एलिमेंट्स.
HTML एलिमेंट्स HTML मार्कअप के लिए आधारभूत घटक हैं. एलिमेंट के दो आधारभूत गुण: एट्रीब्यूट और कंटेंट है. प्रत्येक एलिमेंट के एट्रीब्यूट और प्रत्येक एलिमेंट के कंटेंट में कुछ प्रतिबंध होते हैं, जिनका HTML प्रलेख के सही होने के लिए अनुसरण किया जाना चाहिए. सामान्यतः एलिमेंट में एक स्टार्ट टैग होता है (जैसे- <element-name>
) और एक एंड टैग होता है (जैसे- </element-name>
). एलिमेंट के एट्रीब्यूटों को स्टार्ट टैग में शामिल करते हैं और कंटेंट को टैग्स के बीच में रखते हैं. <element-name attribute="value">Content</element-name>
कुछ एलिमेंट जैसे- <br>
में कोई भी कंटेंट नहीं है एवं इसमें एक क्लोसिंग टैग नहीं होना चाहिए. HTML में इस्तेमाल किए जाने वाले मार्कअप एलिमेंटों के विभिन्न प्रकार नीचे सूचीबद्ध हैं.
स्ट्रक्चरल मार्कअप, पाठ्य के उद्देश्य का वर्णन करती है. उदाहरण के लिए, <h2>Golf
"गोल्फ़" को एक दूसरे-स्तर के शीर्षक के रूप में स्थापित करती है, जिसे इस खंड की शुरुआत में "HTML मार्कअप" की तरह ही ब्राउज़र में प्रतिपादित किया जाएगा.स्ट्रक्चरल मार्कअप, किसी भी विशिष्ट प्रतिपादन को निरूपित नहीं करती है, लेकिन अधिकतर वेब ब्राउज़रों में तत्व संरूपण के लिए मानकीकृत डिफ़ॉल्ट शैली होती है. पाठ्य को आगे कास्केडिंग स्टाइल शीट(CSS) के साथ स्टाइल किया जा सकता है.
प्रेसेंटेशनल मार्कअप, अपने फ़ंक्शन की परवाह न करके पाठ्य के स्वरूप को अंकित करती है. उदाहरण के लिए boldface
यह दर्शाता है कि विज़ुअल आउटपुट डिवाइस "boldface" को गहरे पाठ्य में प्रस्तुत करना चाहिए, लेकिन ऐसा कर पाने में अक्षम उपकरणों के बारे में कोई संकेत नहीं देता कि (जैसे- श्रव्य उपकरण जो पाठ्य को जोर से पढ़ते हैं) उन्हें क्या करना चाहिए. <b>bold
और <i>italic
दोनों के मामले में कुछ तत्व हैं, जो आम तौर पर आभासी प्रदर्शन में समान हैं परन्तु स्वभाव से ज़्यादा सेमेंटिक हैं, अर्थात् क्रमशः <strong>strong emphasis
और <em>emphasis
.यह देखना आसान है कि कैसे एक श्रव्य प्रयोक्ता एजेंट, बाद के दो तत्वों की व्याख्या करता है. तथापि, वे अपने प्रस्तुतिकरण प्रतिरूपों के समान नहीं है: उदाहरण के लिए एक पुस्तक के नाम पर जोर देना एक स्क्रीन-पाठक के लिए अवांछनीय होगा, लेकिन स्क्रीन पर उक्त नाम तिरछा हो जाएगा. अधिकांश प्रेसेंटेशनल मार्कअप तत्व, CSS आधारित स्टाइल डिजाईन के समर्थन में HTML 4.0 विनिर्देशन के अधीन हटा दिए गए हैं.
हाइपरटेक्स्ट मार्कअप एक प्रलेख के हिस्सों को अन्य प्रलेख से जोड़ता है. XHTML 1.1 संस्करण तक के HTML में पाठ्य के प्रवाह में हाइपरलिंक बनाने के लिए एक एंकर तत्व के प्रयोग की आवश्यकता होती है: <a>Wikipedia
तथापि, एक सही URL पर href
एट्रीब्यूट को सेट करना जरूरी है, उदाहरण के तौर पर HTML मार्कअप, <a href="http://en.wikipedia.org/">Wikipedia
"विकिपीडिया" शब्द को हाइपरलिंक के रूप में दर्शाएगा.चित्र को जोड़ने के लिए, एंकर टैग निम्नलिखित सिंटेक्स का प्रयोग करता है: <a href="url"><img src="image.gif" alt="alternative text" width="50" height="50"></a>
<img <a href="url"><img src="image.gif" alt="alternative text" width="50" height="50"></a>
एट्रीब्यूट
एक तत्व के अधिकांश एट्रीब्यूट "=" द्वारा विभक्त नाम-मान के जोड़े के रूप में होते हैं, एवं तत्व के नाम के बाद तत्व के स्टार्ट टैग के भीतर लिखे होते हैं.मान को एक या दोहरे उद्धरण में संलग्न किया जा सकता है, जबकि कुछ निश्चित अक्षरों वाले मान को HTML में बिना उद्धरण के ही छोडा जा सकता है (लेकिन XHTML में नहीं).[33][34] एट्रीब्यूट् के मानों को उद्धरण के बिना छोड़ना असुरक्षित समझा जाता है.[35] नाम-मान जोड़े के एट्रीब्यूट के विपरीत, कुछ एट्रीब्यूट् ऐसे हैं जो केवल तत्व के स्टार्ट टैग में अपनी उपस्थिति द्वारा तत्व को प्रभावित करते हैं.[4] (जैसे img
तत्व के लिए ismap
एट्रीब्यूट् [36]).
अधिकांश तत्व, कई एट्रीब्यूटों में से किसी का भी इस्तेमाल कर सकते हैं.
id
एट्रीब्यूट्, तत्व के लिए एक प्रलेख-व्यापी अद्वितीय अभिज्ञापक प्रदान करता है. इसे स्टाइल-शीटों द्वारा प्रस्तुतिकरण लक्षण प्रदान करने के लिए इस्तेमाल किया जा सकता है, ब्राउज़रों द्वारा विशिष्ट तत्व पर ध्यान केन्द्रित करने के लिए, या स्क्रिप्टों द्वारा विषय-सामग्री या तत्वों की प्रस्तुति में परिवर्तन करने के लिए. पेज के URL में संलग्न, यह तत्व के लिए एक विश्वव्यापी-अद्वितीय अभिज्ञापक प्रदान करता है; विशिष्ट रूप से पेज का एक उप-खंड. उदाहरण के लिए,http://en.wikipedia.org/wiki/HTML#Attributes
में ID "एट्रीब्यूट्".class
एट्रीब्यूट् समान तत्वों को वर्गीकृत करने का एक तरीका प्रदान करता है. इसे सिमेंटिक या प्रस्तुति प्रयोजनों के लिए इस्तेमाल किया जा सकता है.सिमेंटिक के तौर पर, उदहारणतः वर्गों को माईक्रोफॉर्मेट में प्रयोग जाता है प्रस्तुति के तौर पर, उदाहरणतः एक HTML प्रलेख,class="notation"
संकेत का प्रयोग यह बताने के लिए कर सकता है कि उक्त वर्ग मान के सभी तत्व प्रलेख के मुख्य पाठ्य के अधीनस्थ हैं.ऐसे तत्व एकत्रित होकर, HTML स्रोत में प्रदर्शित हो रहे स्थान के बजाय पेज के फ़ुट नोट के रूप में प्रस्तुत हो सकते हैं.- एक लेखक किसी विशिष्ट तत्व के लिए
style
नॉन-एट्रीब्यूट्ल कोड के प्रस्तुतिकरण लक्षण का प्रयोग कर सकता है.एक स्टाइल-शीट के साथ तत्व का चयन करने के लिए तत्व केid
औरclass
एट्रीब्यूट् का प्रयोग करना एक बेहतर अभ्यास माना जाता है, यद्यपि कभी-कभी यह स्टाइल गुणों वाले साधारण तदर्थ अनुप्रयोग के लिए बहुत बोझिल हो सकता है. title
एट्रीब्यूट् का प्रयोग एक तत्व में उप-पाठ्य विवरण को संलग्न करने के लिए किया जाता है. अधिकांश ब्राउज़रों में यह एट्रीब्यूट् उस रूप में प्रदर्शित होता है, जिसे अक्सर Tooltip के रूप में संदर्भित किया जाता है
संकेताक्षर तत्व, abbr
का उपयोग इन विभिन्न एट्रीब्यूटों को प्रदर्शित करने के लिए किया जा सकता है:
-
<abbr id="anId" class="aClass" style="color:blue;" title="Hypertext Markup Language">HTML</abbr>
यह उदाहरण HTML के रूप में प्रदर्शित होता है; अधिकांश ब्राउज़रों में, संक्षिप्त नाम पर कर्सर इंगित करने से शीर्षक पाठ्य "हाइपर टेक्स्ट मार्कअप लैंग्वेज" प्रर्दशित होता है.
अधिकांश तत्व, भाषा संबंधी एट्रीब्यूटों lang
और dir
का भी इस्तेमाल कारते हैं.
कैरेक्टर और एंटिटी संदर्भ
4.0 संस्करण के अनुसार HTML, 252 कैरेक्टर एंटिटी संदर्भ और 1.114.050 संख्यात्मक कैरेक्टर संदर्भ के सेट को परिभाषित करता है, जो दोनों ही अलग-अलग कैरेक्टरों को, शाब्दिक तौर पर लिखने की बजाय सरल मार्कअप के माध्यम से लिखे जाने की अनुमति देते है. एक शाब्दिक अक्षर और उसके मार्कअप प्रतिरूप को बराबर माना जाता है और वे समरूप होते हैं.
इस तरह से कैरेक्टर "पलायन" की क्षमता <
और &
कैरेक्टर (जब क्रमशः < और
के रूप में लिखे हों) को मार्कअप की बजाय कैरेक्टर आंकडा के रूप में व्याख्यायित किये जाने की अनुमति देती है. उदाहरण के लिए, अक्षर &
<
टैग की शुरुआत का और &
सामान्य रूप से एक कैरेक्टर एंटिटी संदर्भ या संख्यात्मक कैरेक्टर संदर्भ की शुरूआत का संकेत करता है; इसे & या &
या &
के रूप में लिखना, &
को तत्व की सामग्री या एट्रीब्यूट्स के मान को शामिल किये जाने की अनुमति देता है; दोहरे-उद्धरण कैरेक्टर ("
) का इस्तेमाल जब एट्रीब्यूट् के मान को उद्धृत करने के लिए हों, तब उसका "
या "
; या "
की तरह पलायन भी किया जाना चाहिए, जब वह एट्रीब्यूट्स मान के अंदर दिखता है.एकल-उद्धरण कैरेक्टर ('
) का इस्तेमाल जब एट्रीब्यूट् के मान को उद्धृत करने के लिए हो, तब उसका ' '
के रूप में (XHTML प्रलेखों के अलावा अन्य में '
के रूप में पलायन नहीं होना चाहिए), जब वह एट्रीब्यूट्स मान के अंदर दिखता है. तथापि, अक्सर प्रलेख लेखकों ने इन कैरेक्टरों के पलायन की आवश्यकता को अनदेखा किया है, तब से उस आशय की पुष्टि करने के लिए अनुवर्ती पाठ्य के प्रकट होने के समय, उनके साथ मार्कअप की तरह ही व्यव्हार करते हुए, ब्राउज़रों ने बहुत क्षमाशील होने की कोशिश की है.
पलायन उन कैरेक्टरों को भी एलिमेंट और एट्रीब्यूट् की सामग्री के भीतर प्रतिनिधित्व करने की अनुमति देती है, जो कि आसानी से टाइप नहीं किये जा सकते या जो प्रलेख के कैरेक्टर एनकोडिंग में उपलब्ध ही नहीं हैं.उदाहरण के लिए, पैने उच्चारण वाले e
, एक कैरेक्टर (é
) को, जो कि विशेष तौर पर पश्चिमी यूरोपीय की-बोर्ड पर ही मिलता है, किसी भी HTML प्रलेख में, एंटिटी संदर्भ é
; या संख्यात्मक सन्दर्भों é
या é
के रूप में लिखा जा सकता है. इन संदर्भों वाले कैरेक्टर (जो &
, the &
, the ;
, और eacute
के सभी अक्षर इत्यादि हैं) सभी की-बोर्ड पर उपलब्ध हैं, और उन्हें कैरेक्टर एनकोडिंग में समर्थन भी प्राप्त है, जबकि अक्षर é
को नहीं है.
डाटा के प्रकार
HTML, एलिमेंट कंटेंट के लिए कई प्रकार के आंकडा प्रकार जैसे- स्क्रिप्ट आंकडा और स्टाइल-शीट आंकडा तथा ID, नाम, URI, नंबर, लंबाई की इकाइयों, भाषाओं, मीडिया विवरणकों, रंग, कैरेक्टर एनकोडिंग, तिथि और समय इत्यादि समेत एट्रिब्यूट मानों के लिए, कई प्रकारों को परिभाषित करती है.ये सभी आंकडा प्रकार, कैरेक्टर आंकडे के विशिष्टीकरण हैं.
प्रलेख प्रकार घोषणा
HTML प्रलेखों को एक प्रलेख प्रकार घोषणा (अनौपचारिक रूप से, एक "doctype") के साथ शुरू करना आवश्यक हैं. ब्राउज़रों में, doctype का कार्य प्रतिपादन मोड को इंगित करना है- खास कर quirks मोड से बचने के लिए.
इस doctype का मूल उद्देश्य डॉक्युमेंट टाइप डिक्लरेशन (DTD) पर आधारित वेलिडेशन को SGML उपकरण के साथ समर्थकारी बनाना था. DTD, जिससे DOCTYPE संदर्भित है, मशीन-पठनीय व्याकरण शामिल है जो इस DTD के अनुरूप प्रलेख के लिए अनुज्ञेय एवं निषिद्ध सामग्री को उल्लिखित करती है. हालांकि ब्राउज़र DTD को नहीं पढ़ते हैं.HTML5 वेलिडेशन DTD-आधारित नहीं है, इसलिए HTML5 में doctype, DTD से संदर्भित नहीं है.
HTML 4 doctype का एक उदाहरण:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
संरूपण को कास्केडिंग स्टाइल शीट, और span
और div
टैगों पर छोड़ते हुए, यह घोषणा HTML 4.01 की स्ट्रिक्ट DTD को संदर्भित करती है, जिसमें <font>
जैसे प्रस्तुतिकरण तत्व नहीं हैं.SGML आधारित वेलीडेटर DTD को प्रलेख की सही पद-व्याख्या और वेलिडेशन को पूरा करने के लिए पढ़ते हैं.आधुनिक ब्राउज़रों में, quirks मोड के विरोध के लिए HTML 4.01 स्ट्रिक्ट doctype, CSS के लिए स्टैण्डर्ड ले-आउट मोड को सक्रिय कर देती है.
इसके अलावा, HTML 4.01 परिवर्ती और फ्रेम सेट DTD प्रदान करती है. परिवर्ती DTD में चाहा गया था कि स्ट्रिक्ट DTD में किए गए बदलाव धीरे-धीरे हों, जबकि फ्रेमसेट DTD उन प्रलेखों के लिए अभिप्रेत था जिनमें फ़्रेम हों.
सिमेंटिक HTML
"सिमेंटिक HTML" कहा जाने वाला कोई आधिकारिक विनिर्देश नहीं है http://www.google.com/search?client=firefox-a&rls=org.mozilla%3Aen-GB%3Aofficial&channel=s&hl=en&q=Semantic+HTML+-wikipedia&btnG=Google+Search. सिमेंटिक HTML ऐसे प्रलेख बनाने के अभ्यास को संदर्भित करती है जिसमें अर्थ की प्रस्तुति से संबंधित बिना किसी सन्दर्भ के ही, केवल लेखक द्वारा अभीष्ट अर्थ शामिल हो.यह प्रस्तुति और सामग्री के अलगाव के विचार का हिस्सा है. उदाहरण के लिए, प्रबलता तत्वऔर तिरछा तत्व
डिफ़ॉल्ट में कार्यात्मक रूप से समान हैं, लेकिन उनके दो अलग अर्थ हैं. सिमेंटिक HTML में मार्कअप के पीछे का अर्थ महत्वपूर्ण है.
CSS का प्रयोग विशिष्ट तौर पर सिमेंटिक HTML में प्रस्तुतिकरण प्रभावों के निर्माण के लिए किया जाता है. CSS के द्वारा, एक डिज़ाइनर उपयुक्त सिमेंटिक मार्कअप के साथ सामग्री बना सकता है और फिर CSS का उपयोग अपने मार्कअप के स्वरूप में परिवर्तन करने के लिए कर सकता है. विचार यह है कि कोड में प्रस्तुतिकरण तत्वों (जैसे तिरछे और गहरे अक्षरलेख) का उपयोग नहीं किया जाना चाहिए, और यह कि उद्धरण की तरह प्रस्तुतिकरण तत्वों के साथ कुछ आशय भी संलग्न होना चाहिए.
सिमेंटिक HTML का लाभ यह है कि सही मार्कअप के लगातार प्रयुक्त होने तक पाठ्य की प्रस्तुति भी लगातार होगी.इसके अलावा, यह मात्र स्टाइल-शीट में संशोधन द्वारा तथा पाठ्य को एक साईट से दूसरे तक स्थानांतरित करने में सक्षम होते हुए, प्रस्तुति को आसानी से बदलने की अनुमति देता है.
मुख्य हानि यह है कि HTML हर कल्पनीय विवरण या आशय के निरूपण के लिए पर्याप्त मार्कअप टैग शामिल नहीं करता है. वैसे तो, लोग अपने अभीष्ट आशय के लिए, आम तौर पर पाठ्य को सही तरह से मार्कअप करने लिए पूर्वनिर्धारित वर्गों के सेट या ID के साथ डिविज़न (
) टैग का इस्तेमाल करते हैं. अगर डिज़ाइनर के पास ऐसे खंडों या आशयों की भरमार है जो कि अच्छी तरह से HTML की मार्कअप के साथ फिट नहीं है, तो वे बहुत से डिविज़न (
) टैगों का उपयोग करने के लिए मजबूर हो सकते हैं, जोकि आसानी से कोड को निस्तेज कर सकता है.
HTML का अंतरण
HTML प्रलेखों को उसी माध्यम से अंतरित किया जा सकता है जिससे अन्य कंप्यूटर-फाइल को किया जाता है, हालांकि इन्हें अक्सर वेब-सर्वर से HTTP के द्वारा या ई-मेल के द्वारा अंतरित किया जाता है.
HTTP
वर्ल्ड वाइड वेब मुख्यतः HTML प्रलेखों से बना है, जोकि हाइपरटेक्स्ट ट्रान्सफर प्रोटोकॉल (HTTP) का उपयोग करते हुए वेब सर्वरों से वेब ब्राउज़रों पर संचारित होते हैं.तथापि, HTML के अतिरिक्त HTTP का उपयोग चित्रों, ध्वनि, और अन्य सामग्रियों को प्रस्तुत करने के लिए होता है. वेब ब्राउज़र को यह जानने के लिए कि कैसे प्रत्येक प्रलेख का नियंत्रण किया जाना है, प्रलेखों के साथ अन्य जानकारी भी संचारित होती है.इस मेटाडाटा में आम तौर पर MIME type (जैसे text/html या application/xhtml+xml) और कैरेक्टर एनकोडिंग शामिल होते हैं (HTML में कैरेक्टर एनकोडिंग देखें).
आधुनिक ब्राउज़रों में, HTML प्रलेख के साथ भेजे जाने वाले MIME प्रकार, प्रलेख की प्रारंभिक व्याख्या को प्रभावित कर सकते हैं. XHTML के साथ भेजे जाने वाले MIME प्रकार प्रलेख का XML में सुनिर्मित होना अपेक्षित होता है, और सिंटेक्स में त्रुटियों के कारण ब्राउजर इसे दर्शाने में विफल हो सकता है. HTML MIME प्रकार के साथ भेजने पर वही प्रलेख सफलतापूर्वक प्रदर्शित हो सकता है, क्योंकि कुछ ब्राउज़र HTML के साथ अधिक उदार होते हैं.
W3C सिफारिशों में बताया गया है कि सिफारिशों के परिशिष्ट-सी में दिखाए गए दिशानिर्देशों का अनुसरण करने वाले XHTML 1.0 प्रलेखों को प्रत्येक MIME प्रकार से लेबल किया जा सकता है.[37] वर्तमान XHTML 1.1 कार्यकारी ड्राफ्ट में भी कहा गया है कि XHTML 1.1 प्रलेखों[38] को प्रत्येक MIME प्रकार के साथ लेबल होना चाहिए.[39]
HTML ई-मेल
अधिकांश ग्राफ़िकल ई-मेल ग्राहकों को संरूपण और सिमेंटिक मार्कअप प्रदान करने के लिए, HTML (अक्सर अपूर्ण रूप से परिभाषित) के उप समुच्चयों का उपयोग करने की अनुमति होती है, जोकि सादे पाठ्य में उपलब्ध नहीं है.इसमें रंगीन शीर्षक, उभरे हुए और उद्धृत पाठ्य, इन-लाइन चित्र और रेखा-चित्र जैसी मुद्रण-सज्जा जानकारी शामिल हो सकती है.ऐसे कई आश्रित दोनों को शामिल कर सकते हैं, जैसे GUI एडीटर को HTML ई-मेल संदेश तैयार करने के लिए और वापस सौंपने वाले इंजन को प्रदर्शन के लिए.HTML के ई-मेल में HTML का प्रयोग संगतता के मुद्दों, यथा यह छद्म-वेष फ़िशिंग हमलों में मदद कर सकता है, स्पैम फिल्टरों को भ्रमित कर सकता है, और संदेश का आकार सादे पाठ्य की अपेक्षा बड़ा होता है आदि की वजह से विवादास्पद है.
नामकरण परंपरा
HTML वाली फ़ाइलों के लिए आम फ़ाइल एक्सटेंशन html है.इसके लिए आम संक्षिप्तीकरण .htm है जिसकी शुरूआत, तीन अक्षरों के सीमित एक्सटेंशन वाले प्रारंभिक ऑपरेटिंग सिस्टमों और फाइल सिस्टमों जैसे- DOS और FAT से हुई थी.
HTML अनुप्रयोग
HTML अनुप्रयोग (HTA; फाइल एक्सटेंशन ".hta"), एक माइक्रोसॉफ्ट विन्डोज़ अनुप्रयोग है, जो अनुप्रयोग के ग्राफ़िकल अंतरफलक प्रदान करने के लिए एक ब्राउज़र में HTML और गत्यात्मक HTML का प्रयोग करती है.एक नियमित HTML फ़ाइल, वेब ब्राउज़रों के साथ संचार तथा वेबपेज बिम्बों एवं साइट कुकीज़ में जोड़-तोड़ करते हुए, केवल वेब-सर्वर के सुरक्षा मॉडल तक ही सीमित होती है. HTA, पूर्ण विश्वसनीय अनुप्रयोग की तरह काम करती है और इसलिए इसके पास सृजन/ संपादन/ फ़ाइलों और विंडोज रजिस्ट्री प्रविष्टियों को हटाने जैसे विशेषाधिकार हैं. ब्राउजर के सुरक्षा मॉडल के बाहर ऑपरेट होने के कारण HTAs का निष्पादन HTTP के द्वारा नहीं हो सकता, परन्तु इसे (एक EXE फ़ाइल की तरह) डाउनलोड करके, स्थानीय फाइल सिस्टम के द्वारा निष्पादित किया जा सकता है.
HTML के वर्तमान प्रकार
सूत्रपात के बाद से ही, HTML और इससे संबद्ध प्रोटोकॉलों को अपेक्षाकृत जल्दी स्वीकृति मिल गई. तथापि, भाषा के शुरूआती वर्षों में कोई स्पष्ट मानक स्थापित नहीं थे. जबकि HTML के रचनाकारों ने इसकी कल्पना, मूल रूप से प्रस्तुति विवरण से विहीन सिमेंटिक लैंग्वेज के रूप में की थी http://www.w3.org/History/19921103-hypertext/hypertext/WWW/MarkUp/HTMLConstraints.html, अधिकांशतः विभिन्न ब्राउज़र विक्रेताओं द्वारा चालित एवं व्यावहारिक उपयोगों द्वारा, बहुत से प्रस्तुतिकरण तत्व और एट्रीब्यूट् भाषा में आ गए. HTML को प्राप्त नवीनतम मानक, किसी समय में भाषा के अराजक विकास से उबरने http://ei.cs.vt.edu/~wwwbtb/book/chap13/who.html और सार्थक एवं अच्छी प्रस्तुति वाले प्रलेखों के लिए एक तर्कसंगत आधार बनाने के प्रयासों के बारे में बताते है. HTML की सिमेंटिक लैंग्वेज के रूप में अपनी भूमिका में वापसी के लिए, W3C ने प्रस्तुति के बोझ को कम करने के लिए CSS और XSL जैसी स्टाइल भाषाओं को विकसित किया.संयोजन में, HTML विनिर्देश धीरे-धीरे प्रस्तुतिकरण तत्वों के नियंत्रण में चले गए.
HTML के विभिन्न प्रकारों में भेद करते हुए संप्रति दो धुरी निर्दिष्ट हैं: SGML-आधारित HTML बनाम XML-आधारित HTML (XHTML के रूप में) एक धुरी पर, और सख्त बनाम परिवर्ती (ढीले) बनाम फ्रेमसेट दूसरी धुरी पर.
SGML-आधारित बनाम XML-आधारित HTML
नवीनतम HTML विशिष्टताओं में एक अंतर, SGML-आधारित विनिर्देश एवं XML-आधारित विनिर्देश के बीच का भेद है. पारंपरिक परिभाषा से स्पष्ट रूप से भेद करने के लिए, XML-आधारित विनिर्देश को आम तौर पर XHMTL कहा जाता है; लेकिन XHTML-निर्दिष्ट HTML में भी 'html' मूल तत्व नाम के रूप में जारी है. W3C ने अधिक जटिल SGML पर XML की परिमितताओं में कार्य करने की आवश्यकता वाले मामलों के अतिरिक्त, XHTML 1.0 का XHTML 4.01 के समान होना चाहा था.चूंकि XHTML और HTML में निकट संबंध हैं, वे कभी-कभी समानांतर प्रलेखित होते हैं.ऐसी हालात में, कुछ लेखक दो नामों को (X)HTML या X(HTML) के रूप में मिला देते हैं.[40]
HTML 4.01 की तरह, XHTML 1.0 में भी तीन उप-विनिर्देश हैं: स्ट्रिक्ट, लूज़ और फ्रेमसेट.
प्रलेख संबंधी विभिन्न प्रारंभिक घोषणाओं से अलग, HTML 4.01 और XHTML 1.0 प्रलेख के बीच के अंतर - प्रत्येक तदनुरूप DTDs में — बड़े पैमाने पर वाक्यात्मक हैं. HTML के अंतर्निहित सिंटेक्स, वैकल्पिक खुलने या बंद होने वाले टैगों के साथ तत्व, और बिना बंद-टैग वाले EMPTY तत्वों जैसे कई शॉर्टकट की अनुमति देते है, XHTML में इसकी अनुमति नहीं है. इसके विपरीत, XHTML में सभी तत्वों के लिए एक खुलने वाला टैग या एक बंद-टैग ज़रूरी होता है.हालांकि, XHTML भी एक नया शॉर्टकट प्रस्तावित करती है:
की तरह टैग के अंत से पहले एक स्लैश शामिल करके एक XHTML टैग को एक ही टैग के भीतर खोला या बंद किया जा सकता है.इस आशुलिपि के परिचय से, जिसका उपयोग HTML 4.01 के लिए SGML घोषणा में उपयोग नहीं किया जाता है, प्रारंभिक सॉफ्टवेयर भ्रमित हो सकते हैं जोकि इस नई परिपाटी से अपरिचित है.इसको फिक्स करने के लिए, टैग को बंद करने से पहले एक खाली-स्थान छोड़ना होता है जैसे:
.[41]
HTML और XHTML के बीच के सूक्ष्म अंतर को समझने के लिए, एक सही और सुनिर्मित XHTML 1.0 प्रलेख के रूपांतर पर विचार करें जो सही HTML 4.01 प्रलेख में परिशिष्ट-सी में जुडा है (नीचे देखें).इसे अनूदित करने के लिए निम्न चरणों की आवश्यकता होती है:
- एक तत्व के लिए भाषा को XHTML
xml:lang
ऐट्रीब्यूट की बजाय एकlang
एट्रीब्यूट के साथ निर्दिष्ट किया जाना चाहिए .XHTML , XML में सन्निहित भाषा-परिभाषी कार्यशीलता एट्रीब्यूट का उपयोग करता है. - XML नेम-स्पेस (
xmlns=URI
) को हटायें . HTML में नेम-स्पेस के लिए कोई सुविधा नहीं है. - प्रलेख प्रकार परिभाषा को XHTML 1.0 से HTML 4.01 में बदल देता है (अधिक विवरण के लिए DTD खंड देखें).
- यदि उपस्थित है, XML घोषणा को हटा दें . (आमतौर पर यह है:
<?
xml version="1.0" encoding="utf-8"?>
- प्रलेख के MIME प्रकार का
text/html
में सेट होना सुनिश्चित करता है . HTML और XHTML दोनों के लिए, यह सर्वर के द्वारा भेजे HTTP शीर्षकContent-Type
से आता है. - XML खाली-तत्व सिंटेक्स को HTML स्टाइल तत्व सिंटेक्स में बदलता है (
को
में).
ये मुख्य परिवर्तन है जो प्रलेख को XHTML 1.0 से HTML 4.01 में अनूदित करने के लिए आवश्यक है. HTML से XHTML में अनुवाद करने के लिए किसी छोड़े गए खुले या बंद-टैगों को शामिल करने की भी आवश्यकता होगी. HTML या XHTML किसी में भी कोडिंग हो, HTML प्रलेख में, कौन-सा टैग छोडा जा सकता है यह याद करने की बजाय छोड़े गए वैकल्पिक टैग को शामिल करना हमेशा सर्वश्रेष्ठ होता है
एक सुनिर्मित XHTML प्रलेख, XML के सभी सिंटेक्स की आवश्यकताओं का पालन करता है. एक सही प्रलेख XHTML के लिए सामग्री विनिर्देशन का समर्थन करता है, जो प्रलेख की संरचना का वर्णन करती है.
W3C ने HTML और XHTML के बीच एक आसान अंतरण को सुनिश्चित करने के लिए कई रूढियों की सिफारिश की है (HTML संगतता मार्गनिर्देश देखें). निम्नलिखित चरणों को केवल XHTML 1.0 प्रलेखों में प्रयुक्त किया जा सकता है:
- किसी भी तत्व निर्दिष्ट भाषा में
xml:lang
औरlang
, दोनों एट्रीब्यूट को शामिल करें. - खाली-तत्व सिंटेक्स का प्रयोग केवल उन्हीं तत्वों के लिए करें जो HTML में खाली के रूप में निर्दिष्ट हैं.
- खाली-तत्व टेगों में एक अतिरिक्त स्थान शामिल करें: उदाहरण के लिए
के बजाय
. - तत्वों के लिए स्पष्ट बंद टेगों को शामिल करें, जो अंतर्वस्तु को अनुमति देते हैं, लेकिन खाली छोडे जाते हैं (उदाहरण के लिए,
,
नहीं).
- XML घोषणा को छोड़ दें.
W3C की अनुकूलता दिशा-निर्देशों का ध्यान से अनुसरण करके, एक प्रयोक्ता एजेंट को प्रलेख की व्याख्या करने में HTML या XHTML के जैसा सक्षम होना चाहिए. ऐसे प्रलेखों को, जो XHTML 1.0 हैं और जिन्हें इस तरह से अनुकूल बनाया गया है, W3C या तो HTML के रूप में (एक MIME प्रकार text/html
के साथ) या XHTML के रूप में (एक MIME प्रकार application/xhtml+xml
या application/xml
के साथ) प्रस्तुत करता है. XHTML के रूप में प्रतिपादन के समय ब्राउज़रों को एक XML पार्सर का प्रयोग करना चाहिए जो प्रलेख की अंतर्वस्तु को पार्स करने के लिए XML विनिर्देशों का सख्ती से पालन करता है.
परिवर्ती बनाम सख्त
यह section पाठकों को अव्यवस्थित या अस्पष्ट प्रतीत हो सकता है। लेख को स्पष्ट करने में मदद करें, सुझाव वार्ता पृष्ठ पर पाये जा सकते हैं। (February 2009) |
नवीनतम SGML-आधारित विनिर्देश HTML 4.01 और प्रारंभिक XHTML संस्करण में तीन उप-विनिर्देश: सख्त, परिवर्ती (पहले ढीली कही जाती थी), और फ्रेमसेट शामिल हैं. सख्त प्रकार, मानक का सही प्रतिनिधित्व करता है जबकि परिवर्ती और फ्रेमसेट प्रकारों को HTML (HTML 3.2 सहित) के पूर्व संस्करणों से परिवर्तन में सहायता करने के लिए विकसित किया.परिवर्ती और फ्रेमसेट प्रकार प्रदर्शनकारी मार्कअप के लिए अनुमति देते हैं जबकि सख्त प्रकार अति प्रदर्शनकारी मार्कअप के लोप द्वारा स्टाइल शीट के उपयोग को प्रोत्साहित करती है.
प्राथमिक असमानताएं जो परिवर्ती प्रकार को सख्त की बजाय अधिक अनुज्ञाप्रद बनाती हैं (HTML 4 और XHTML 1.0 के सामान अंतर )वे निम्न हैं:
- एक लूज़र कंटेंट मॉडल
- इन-लाइन तत्वों और सादा टेक्स्ट (# PCDATA) की
body
,blockquote
,form
,noscript
औरnoframes
में सीधे अनुमति दी हैं:
- इन-लाइन तत्वों और सादा टेक्स्ट (# PCDATA) की
- प्रस्तुतिकरण संबंधी तत्व
- (
u
) रेखांकित - strike-through (काटना) (
s
) center
font
basefont
- (
- प्रस्तुति संबंधित एट्रीब्यूट
body
तत्व के लिएbackground
औरbgcolor
एट्रीब्यूटdiv
,form
पैराग्राफ (p
), और शीर्षक (h1
...h6
) तत्वों परalign
एट्रीब्यूटhr
तत्व परalign
,noshade
,size
औरwidth
एट्रीब्यूटimg
औरobject
तत्वों परalign
,border
,vspace
औरhspace
एट्रीब्यूटlegend
औरcaption
तत्वों परalign
एट्रीब्यूटtable
तत्व परalign
औरbgcolor
td
औरth
तत्वों परnowrap
,bgcolor
width
,height
tr
परbgcolor
एट्रीब्यूटbr
तत्व परclear
एट्रीब्यूटdl
,dir
औरmenu
तत्वों परcompact
एट्रीब्यूटo1
औरul
तत्वों परtype
,compact
औरstart
एट्रीब्यूटli
तत्व परtype
औरvalue
एट्रीब्यूटpre
तत्व परwidth
एट्रीब्यूट
- परिवर्ती विनिर्देश में अतिरिक्त तत्व
menu
सूची (कोई विकल्प नहीं है, यद्यपि बिना क्रम वाली सूची की सिफारिश; XHTML 2.0 विनिर्देश में वापस आ सकती है)dir
सूची (कोई विकल्प नहीं है, यद्यपि बिना क्रम वाली सूची की सिफारिश की जाती है)isindex
(तत्व के लिए सर्वर-साइड समर्थन की आवश्यकता है और इस विशिष्ट तौर पर प्रलेखों की सर्वर-साइड में जोड़ा जाता है)applet
(बिम्ब तत्व के पक्ष में पदावनत)
- स्क्रिप्ट तत्व पर
language
एट्रीब्यूट (type
एट्रीब्यूट के साथ संभाव्यतः निरर्थक, हालांकि इसे विरासत कारणों से बनाए रखा है) - फ़्रेम संबंधित इकाइयां
framset
तत्व (फ्रेम सेट DTD के लिए मुख्य भाग के स्थान पर प्रयुक्त)frame
तत्वiframe
noframes
anchor
, आश्रित-पक्ष इमेज-मैप (imagemap
),link
,form
औरbase
तत्वों परtarget
एट्रीब्यूट
फ्रेमसेट बनाम परिवर्ती
उपरोक्त परिवर्ती असमानताओं के अलावा, फ्रेमसेट विनिर्देश (चाहे XHTML 1.0 या HTML 4.01) body
के साथ frame
और वैकल्पिक तौर पर noframes
तत्व युक्त frameset
रिप्लेसिंग body
के साथ एक अलग कंटेंट मॉडल को निर्दिष्ट करता है.
प्रकारों का संक्षिप्त विवरण
जैसा कि इस सूची में दर्शाया गया है, विनिर्देश के लूज़ प्रकार को विरासत का समर्थन करने के लिए बनाए रखा है. हालांकि, प्रचलित गलतफहमियों के विपरीत, XHTML की तरफ बढ़ना इस विरासत समर्थन को हटाने का संकेत नहीं करता है. बल्कि XML में X का मतलब एक्स्टेंसिबल होता है और W3C पूरे विनिर्देश का नियमन करके इसे निरपेक्ष एक्सटेंशन के रूप में प्रारंभ कर रहा है. XHTML 1.0 से XHTML 1.1 की तरफ बढ़ने पर पूरे विनिर्देश का नियमन प्राथमिक उपलब्धि है. HTML का स्ट्रिक्ट संस्करण XHTML 1.1 में आधारभूत XHTML 1.1 विनिर्देश के लिए अनुखंडीय एक्सटेंशन के एक सेट के माध्यम से परिनियोजित किया गया है. इसी तरह, लूज (परिवर्ती) या फ्रेम सेट विनिर्देश चाहने वालों को उसी तरह का विस्तृत XHTML 1.1 समर्थन प्राप्त होगा (विरासत या फ्रेम मॉड्यूलों में अधिकांशतः उपलब्ध).मॉड्यूलीकरण अलग विशेषताओं को उनके अपने समय पर विकसित होने की अनुमति देता है. अतएव उदाहरण के लिए XHTML 1.1 उभरते XML मानकों जैसे- MathML (XML पर आधारित एक प्रस्तुतिकरण सिमेंटिक मैथ लैंग्वेज) और XForms- मौजूदा HTML रूपों को बदलने के लिए एक नई काफी उन्नत वेब-फॉर्म प्रौद्योगिकी के तेज अंतरण की अनुमति देती है.
संक्षेप में, HTML 4.01 विनिर्देश प्रारंभ में SGML पर आधारित एक स्पष्ट लिखित विनिर्देश के अंदर समस्त विभिन्न HTML निष्पादनों के नियंत्रण में थे. XHTML 1.0 ने इस विनिर्देशन को नए XML परिभाषित विनिर्देश के रूप में बदल दिया. इसके बाद, XHTML 1.1, XML के वितान्य प्रकृति का फायदा उठाते हुए पूरे विनिर्देश का मॉड्यूलीकरण कर दिया.XHTML 2.0, एक मानक-मुख्य भाग-आधारित दृष्टिकोण में विनिर्देशन के लिए नई सुविधाएं जोड़ने में पहला कदम होगा.
HTML में हाइपर टेक्स्ट सुविधाओं का न होना
HTML में प्रारंभिक हाइपर टेक्स्ट प्रणालियों में पाई जाने वाली कुछ सुविधाएं जैसे, टाइप लिंक, स्रोत ट्रैकिंग, फेट लिंक आदि का अभाव है.[42] HTML के प्रारंभिक संस्करणों में विद्यमान कुछ हाइपर टेक्स्ट सुविधाओं जैसे लिंक तत्व और इन-ब्राउजर वेब पेज संपादन को भी सर्वाधिक प्रचलित वेब ब्राउज़रों द्वारा हाल तक नजरअंदाज किए गए.
कभी-कभी वेब सेवाओं या ब्राउज़र निर्माताओं द्वारा इन कमियों के उपाय सुझाए जाते हैं. उदाहरण के लिए, wikis और सामग्री प्रबंधन प्रणालियां सर्फ़ करने वालों को उनके द्वारा देखे गए वेब पृष्ठों को संपादित करने की अनुमति देती हैं.
यह भी देखें
- Breadcrumb (नेविगेशन)
- HTML दशमलव कैरेक्टर रेंडरिंग
- HTML तत्व
- कंप्यूटर मानकों की सूची
- प्रलेख मार्कअप लैंग्वेज की सूची
- माईक्रोफार्मेट्स
- द HTML सोर्सबुक: द कंप्लीट गाइड टु HTML (1995 से ऐतिहासिक संदर्भ)
- JHTML
- XHTML
संदर्भ
- ↑ टिम बेर्नेर्स-ली, "सूचना प्रबंधन: एक प्रस्ताव." CERN (मार्च 1989, मई 1990). http://www.w3.org/History/1989/proposal.html
- ↑ टिम Berners-ली, "डिजाइन मुद्दे" http://www.w3.org/DesignIssues/
- ↑ टिम बेर्नेर्स-ली, "डिजाइन मुद्दे" http://www.w3.org/DesignIssues/Uses.html
- ↑ "First mention of HTML Tags on the www-talk mailing list". World Wide Web Consortium. 1991-10-29. अभिगमन तिथि 2007-04-08.
- ↑ "Index of elements in HTML 4". World Wide Web Consortium. 1999-12-24. अभिगमन तिथि 2007-04-08.
- ↑ Tim Berners-Lee (1991-12-09). "Re: SGML/HTML docs, X Browser (archived www-talk mailing list post)". अभिगमन तिथि 2007-06-16.
SGML is very general. HTML is a specific application of the SGML basic syntax applied to hypertext documents with simple structure.
- ↑ अ आ Raymond, Eric. "IETF and the RFC Standards Process". [[The Art of Unix Programming]].
In IETF tradition, standards have to arise from experience with a working prototype implementation — but once they become standards, code that does not conform to them is considered broken and mercilessly scrapped. …Internet-Drafts are not specifications, and software implementers and vendors are specifically barred from claiming compliance with them as if they were specifications. Internet-Drafts are focal points for discussion, usually in a working group… Once an Internet-Draft has been published with an RFC number, it is a specification to which implementers may claim conformance. It is expected that the authors of the RFC and the community at large will begin correcting the specification with field experience.
URL–wikilink conflict (मदद) - ↑ "HTML+ Internet-Draft - Abstract".
Browser writers are experimenting with extensions to HTML and it is now appropriate to draw these ideas together into a revised document format. The new format is designed to allow a gradual roll over from HTML, adding features like tables, captioned figures and fill-out forms for querying remote databases or mailing questionnaires.
- ↑ "RFC 1866: Hypertext Markup Language - 2.0 - Acknowledgments". Internet Engineering Task Force. 2005-09-22. अभिगमन तिथि 2007-06-16.
Since 1993, a wide variety of Internet participants have contributed to the evolution of HTML, which has included the addition of in-line images introduced by the NCSA Mosaic software for WWW. Dave Raggett played an important role in deriving the forms material from the HTML+ specification. Dan Connolly and Karen Olson Muldrow rewrote the HTML Specification in 1994. The document was then edited by the HTML working group as a whole, with updates being made by Eric Schieler, Mike Knezovich, and Eric W. Sink at Spyglass, Inc. Finally, Roy Fielding restructured the entire draft into its current form.
- ↑ "RFC 1866: Hypertext Markup Language - 2.0 - Introduction". Internet Engineering Task Force. 2005-09-22. अभिगमन तिथि 2007-06-16.
This document thus defines an HTML 2.0 (to distinguish it from the previous informal specifications). Future (generally upwardly compatible) versions of HTML with new features will be released with higher version numbers.
- ↑ अ आ इ ई Raggett, Dave (1998). Raggett on HTML 4. अभिगमन तिथि 2007-07-09.
- ↑ "HTML 3.2 Reference Specification". World Wide Web Consortium. 14-January-1997. अभिगमन तिथि 2008-11-16.
|date=
में तिथि प्राचल का मान जाँचें (मदद) - ↑ "IETF HTML WG". अभिगमन तिथि 2007-06-16.
NOTE: This working group is closed
- ↑ "HTML 4.0 Specification". World Wide Web Consortium. 18-December-1997. अभिगमन तिथि 2008-11-16.
|date=
में तिथि प्राचल का मान जाँचें (मदद) - ↑ Arnoud Engelfriet. "Introduction to Wilbur". Web Design Group. अभिगमन तिथि 2007-06-16.
- ↑ "HTML 4.0 Specification". World Wide Web Consortium. 24-April-1998. अभिगमन तिथि 2008-11-16.
|date=
में तिथि प्राचल का मान जाँचें (मदद) - ↑ "HTML 4.01 Specification". World Wide Web Consortium. 24 December 1999. अभिगमन तिथि 2008-11-16.
- ↑ https: / / www.cs.tcd.ie/15445/15445.HTML
- ↑ Hypertext मार्कअप भाषा: पुनर्प्राप्ति और अंतरपरिवर्तन के लिए पाठ्य सूचना और मेटासूचना का प्रतिनिधित्व
- ↑ "HTML 3.0 Draft (Expired!) Materials". World Wide Web Consortium. 1995-12-21. अभिगमन तिथि 2008-11-16.
- ↑ "HyperText Markup Language Specification Version 3.0". अभिगमन तिथि 2007-06-16.
- ↑ "Extensions to HTML 3.0". Netscape. मूल से 2006-11-13 को पुरालेखित.
Netscape remains committed to supporting HTML 3.0. To that end, we've gone ahead and implemented several of the more stable proposals, in expectation that they will be approved. …In addition, we've also added several new areas of HTML functionality to Netscape Navigator that are not currently in the HTML 3.0 specification. We think they belong there, and as part of the standards process, we are proposing them for inclusion.
- ↑ "Press Release: W3C Publishes Public Draft of CSS2". World Wide Web Consortium. 4 November, 1997 SOPHIA-ANTIPOLIS, FRANCE. अभिगमन तिथि 2008-11-16.
|date=
में तिथि प्राचल का मान जाँचें (मदद) - ↑ "HTML 5". World Wide Web Consortium. 10 June 2008. अभिगमन तिथि 2008-11-16.
- ↑ "HTML 5, one vocabulary, two serializations". अभिगमन तिथि 2009-02-25.
- ↑ "XHTML 1.0: The Extensible HyperText Markup Language (Second Edition)". World Wide Web Consortium. 26 January 2000. अभिगमन तिथि 2008-11-16.
- ↑ "XHTML 1.1 - Module-based XHTML - Second Edition". World Wide Web Consortium. 16 February 2007. अभिगमन तिथि 2008-11-16.
- ↑ "XHTM 2.0". World Wide Web Consortium. 26 July 2006. अभिगमन तिथि 2008-11-16.
- ↑ "XHTML 2 Working Group Expected to Stop Work End of 2009, W3C to Increase Resources on HTML 5". World Wide Web Consortium. 17 July 2009. अभिगमन तिथि 2008-11-16.
- ↑ "HTML5". World Wide Web Consortium. 24 October 2008. अभिगमन तिथि 2008-11-16.
- ↑ Doctype के साथ ब्राउज़र मोड को सक्रिय करना
- ↑ "On SGML and HTML". World Wide Web Consortium. अभिगमन तिथि 2008-11-16.
- ↑ "XHTML 1.0 - Differences with HTML 4". World Wide Web Consortium. अभिगमन तिथि 2008-11-16.
- ↑ Korpela, Jukka (1998-07-06). "Why attribute values should always be quoted in HTML". Cs.tut.fi. अभिगमन तिथि 2008-11-16.
- ↑ "Objects, Images, and Applets in HTML documents". World Wide Web Consortium. 1999-12-24. अभिगमन तिथि 2008-11-16.
- ↑ "XHTML 1.0 The Extensible HyperText Markup Language (Second Edition)". World Wide Web Consortium. 2000, revised 2002. अभिगमन तिथि 7 December 2008.
XHTML Documents which follow the guidelines set forth in Appendix C, "HTML Compatibility Guidelines" may be labeled with the Internet Media Type "text/html" [RFC2854], as they are compatible with most HTML browsers. Those documents, and any other document conforming to this specification, may also be labeled with the Internet Media Type "application/xhtml+xml" as defined in [RFC3236].
|date=
में तिथि प्राचल का मान जाँचें (मदद) - ↑ "RFC 2119: Key words for use in RFCs to Indicate Requirement Levels". Harvard University. 1997. अभिगमन तिथि 7 December 2008.
3. SHOULD This word, or the adjective "RECOMMENDED", mean that there may exist valid reasons in particular circumstances to ignore a particular item, but the full implications must be understood and carefully weighed before choosing a different course.
- ↑ "XHTML 1.1 - Module-based XHTML - Second Edition". World Wide Web Consortium. 2007. अभिगमन तिथि 7 December 2008.
XHTML 1.1 documents SHOULD be labeled with the Internet Media Type text/html as defined in [RFC2854] or application/xhtml+xml as defined in [RFC3236].
- ↑ देखें, XHTML # HTML से सम्बन्ध
- ↑ Freeman, E(2005). Freeman, E (2005). Head First HTML. O'Reilly.
- ↑ Jakob Nielsen (2005-01-03). "Reviving Advanced Hypertext". अभिगमन तिथि 2007-06-16.
बाह्य लिंक
विकिपुस्तक पर HyperText Markup Language से सम्बन्धित एक किताब है। |
विकिविश्वविद्यालय में एच.टी.एम.एल. पर पाठ्य सामग्री उपलब्ध है: |
विकिविश्वविद्यालय में HTML Challenges पर पाठ्य सामग्री उपलब्ध है: |