"एच.टी.एम.एल.": अवतरणों में अंतर

मुक्त ज्ञानकोश विकिपीडिया से
छो Bot: अंगराग परिवर्तन
छो r2.7.3) (रोबॉट: ur:وراۓمتن زبان تدوین की जगह ur:ورائےمتن زبان تدوین जोड़ रहा है
पंक्ति 460: पंक्ति 460:
[[tr:HTML]]
[[tr:HTML]]
[[uk:HTML]]
[[uk:HTML]]
[[ur:وراۓمتن زبان تدوین]]
[[ur:ورائےمتن زبان تدوین]]
[[uz:HTML]]
[[uz:HTML]]
[[vi:HTML]]
[[vi:HTML]]

16:22, 12 फ़रवरी 2013 का अवतरण

HTML
(Hyper Text Markup Language)
संचिकानाम विस्तार .html, .htm
इंटरनेट मीडिया प्रकार text/html
प्रकार कोड TEXT
युनीफ‘ओर्म प्रकार आइडेन्टिफायर public.html
द्वारा विकसित World Wide Web Consortium & WHATWG
फॉर्मैट का प्रकार Markup language
से विस्तृत SGML
को विस्तृत XHTML
मानक

W3C HTML 4.01

W3C HTML 3.2

HTML (अंग्रेज़ी: Hypertext Markup Language) जिसका पूरा नाम हाइपरटेक्स्ट मार्कअप लैंग्वेज है, वेब पेजों के निर्माण के लिए प्रमुख मार्कअप भाषा है शीर्षक, अनुच्छेद, सूची आदि जैसे पाठ्य एवं साथ ही लिंक, उद्धरण तथा अन्य मदों के लिए भी, संरचनात्मक शब्दार्थ बता कर संरचित दस्तावेज तैयार करने के लिए यह एक ज़रिया प्रदान करती है. यह चित्रों और बिंबों को अनुमत करती है एवं इसका प्रयोग पारस्परिक क्रिया संबंधी प्रारूपों को तैयार करने के लिए किया जा सकता है. इसे वेब-पेज सामग्री के भीतर कोण कोष्ठकों से घिरे "टैग्स" युक्त HTML तत्वों के रूप में लिखा जाता है.यह जावास्क्रिप्ट जैसी भाषाओं के स्क्रिप्ट्स शामिल या लोड कर सकती है, जो पाठ्य और अन्य सामग्री के रूप और विन्यास को निरूपित करने के लिए वेब ब्राउजर और कास्केडिंग स्टाइल शीट्स(CSS) जैसे HTML प्रोसेसर के आचरण को प्रभावित करती है.सुस्पष्ट प्रतिपादक मार्कअप की तुलना में CSS के उपयोग को प्रोत्साहित किया गया है.

HTML का इतिहास

उद्गम

टिम बर्नर्स-ली

1981 में भौतिक विज्ञानी टिम बर्नर्स-ली ने, जो CERN में एक स्वतंत्र ठेकेदार थे, CERN शोधकर्ताओं के लिए दस्तावेजों के उपयोग और आपस में बांटने के लिए एक प्रणाली ENQUIRE को प्रस्तावित कर उसका नमूना तैयार किया. 1989 में बर्नर्स-ली और CERN डाटा सिस्टम के इंजीनियर रॉबर्ट कैलियाउ ने एक-सी कार्यात्मकता वाले इंटरनेट-आधारित हाइपरटेक्स्ट प्रणाली के लिए अलग-अलग प्रस्ताव पेश किए. अगले वर्ष, उन्होंने एक संयुक्त प्रस्ताव, WorldWideWeb(W3)[1] परियोजना पर एक साथ काम किया, जिसे CERN ने स्वीकार किया. 1990 के अपने व्यक्तिगत नोट्स[2] से "जिन कई क्षेत्रों में हाइपरटेक्स्ट का प्रयोग होता है, उनमें से कुछ को " सूचीबद्ध[3] किया, और एक विश्वकोश को पहले रखा.

प्रथम विनिर्देशन

HTML के बारे में सार्वजनिक रूप से उपलब्ध प्रथम विवरण HTML टैग नामक एक दस्तावेज़ था, जिसका उल्लेख 1991 के आखिर में इंटरनेट पर सबसे पहले बर्नर्स-ली द्वारा किया गया था.[4][5] इसमें प्रथमाक्षर, HTML की अपेक्षाकृत सरल डिजाईन को शामिल करते हुए 22 तत्वों का वर्णन है. इन तत्वों में से तेरह अभी भी HTML 4 में मौजूद हैं.[6] HTML, वेब पृष्ठों के गतिशील प्रारूपण के लिए, वेब ब्राउज़र द्वारा प्रयुक्त पाठ्य और चित्रों के संरूपण की भाषा है. इसके कई टैगों के शब्दार्थ विन्यास को, CTSS (कंम्पैटिबल टाइम-शेयरिंग सिस्टम) ऑपरेटिंग सिस्टम के लिए 1960 के प्रारंभ में विकसित किए गए RUNOFF कमांड द्वारा प्रयुक्त प्रारंभिक पाठ्य संरूपण भाषाओं से जोड़ा जा सकता है, और इसके संरूपण आदेश, टाइपसेट्टर द्वारा प्रलेखों को हाथ से प्रारूपित करने के लिए प्रयुक्त आदेशों से व्युत्पन्न हैं.

बर्नर्स-ली ने HTML को SGML का अनुप्रयोग माना, और 1993 के मध्य में इंटरनेट इंजीनियरिंग टास्क फोर्स (IETF) द्वारा बर्नर्स-ली और डैन कोन्नोल्ली के इंटरनेट-ड्राफ्ट, एक HTML विनिर्देशन: "हाइपरटेक्स्ट मार्कअप लैंग्वेज (HTML)" के लिए प्रथम प्रस्ताव के प्रकाशन के साथ औपचारिक रूप से इस रूप में परिभाषित किया गया था, जिसमें व्याकरण को परिभाषित करने के लिए एक SGML प्रलेख प्रकार परिभाषा शामिल थी.[7] ड्राफ्ट छह महीनों के बाद समाप्त हो गया, लेकिन IETF की सफल प्रोटोटाइप पर आधारित मानकों के तत्व-विचार को प्रतिबिंबित करते हुए, इन-लाइन चित्रों को शामिल करने के लिए NCSA मोज़ैक ब्राउज़र के कस्टम टैग की अभिस्वीकृति के लिए उल्लेखनीय रहा.[8] इसी प्रकार, 1993 के अंत में डेव राग्गेट के प्रतिस्पर्धी इंटरनेट-ड्राफ्ट, "HTML + (Hypertext markup format)", ने टेबल और फिल-आउट फॉर्म जैसी पहले से लागू सुविधाओं के मानकीकरण का सुझाव दिया.[9]

1994 की शुरूआत में HTML और HTML + ड्राफ्ट के समापन के बाद, IETF ने एक HTML कार्य समूह बनाया, जिसने 1995 में "HTML 2.0" को पूर्ण किया, जो कि मानक के रूप में व्यवहृत किए जाने के लिए अभिप्रेत प्रथम HTML विनिर्देशन था, जिस पर भावी कार्यान्वयन आधारित हो.[8] 1866 टिप्पणियों के लिए अनुरोध के रूप में प्रकाशित, HTML 2.0 में HTML एवं HTML+ ड्राफ्ट के विचार भी शामिल थे.[10] कोई "HTML 1.0" मौजूद नहीं था; 2.0 संकेत, पिछले ड्राफ्ट से नए संस्करण को अलग करने के लिए अभिप्रेत था.[11]

IETF के तत्वावधान में आगे का विकास प्रतिस्पर्धी हितों के कारण रुक गया था. 1996 के बाद से, विश्व व्यापी वेब संघ (W3C) ने, वाणिज्यिक सॉफ्टवेयर विक्रेताओं से निविष्टियों के साथ, HTML विनिर्देशों को संभाला है.[12] तथापि, 2000 में HTML भी एक अंतर्राष्ट्रीय मानक बन गया(ISO/IEC 15445:2000).W3C द्वारा प्रकाशित आखिरी HTML विनिर्देश, 1999 के अंत में प्रकाशित HTML 4.01 सिफ़ारिश था. आखिरी बार इसके मुद्दों और त्रुटियों को 2001 में प्रकाशित अशुद्धियों की सूची द्वारा अभिस्वीकृत किया गया था.

मानक का संस्करण इतिहास

HTML
इस संदूक को: देखें  संवाद  संपादन

HTML संस्करण समय-क्रम

नवंबर 1995
HTML 2.0 को IETF RFC 1866 के रूप में प्रकाशित किया गया था. पूरक RFCद्वारा जोड़ी क्षमताएं:
जून 2000 में, RFC 2854 द्वारा इन सभी को अप्रचलित/ऐतिहासिक घोषित किया गया .
जनवरी 1997
HTML 3.2[13] को W3C की एक सिफारिश के रूप में प्रकाशित किया गया. यह विशेष रूप से W3C द्वारा मानकीकृत एवं विकसित पहला संस्करण था, क्योंकि IETF ने सितंबर 1997 में अपने HTML कार्य समूह को बंद कर दिया था.[14]
HTML 3.2 ने गणित के फ़ार्मूलों को पूरी तरह से हटा कर, विभिन्न स्वाम्य एक्सटेंशनों के बीच अतिव्यापन को समंजित किया, और नेटस्केप के अधिकांश आभासी मार्कअप टैगों को अपना लिया. नेटस्केप के ब्लिंक एलिमेंट और माइक्रोसॉफ्ट के मार्की एलिमेंट को, दोनों कंपनियों के बीच एक आपसी समझौते की वजह से छोड़ दिया गया.[12] 14 महीने बाद MathML तक, गणितीय फ़ार्मुलों के लिए HTML के समान मार्कअप नहीं था.
दिसंबर 1997
HTML 4.0[15] को W3C सिफारिश के रूप में प्रकाशित किया गया था. यह तीन "फ़्लेवर्स" प्रस्तुत करता है:
  • सख्त, जिसमें पदावनत तत्वों को वर्जित किया गया है.
  • परिवर्ती, जिसमें पदावनत तत्वों की अनुमति है,
  • फ्रेमसेट, जिसमें ज्यादातर केवल फ्रेम संबंधित तत्वों की अनुमति है;
प्रारंभ में कोड-नाम "कौगर",[16] HTML 4.0 ने कई ब्राउज़र-विशेष तत्त्व प्रकारों और एट्रीब्यूटों को अपनाया, लेकिन साथ ही स्टाइल शीट के पक्ष में नेटस्केप के आभासी मार्कअप एट्रीब्यूट को पदावनत अंकित करके उसे बाहर करने का प्रयास भी किया.
अप्रैल 1998
संस्करण संख्या को न बढ़ाते हुए, HTML 4.0[17] को मामूली सुधारों के साथ दुबारा जारी किया गया.
दिसंबर 1999
HTML 4.01[18] को एक W3C सिफारिश के रूप में प्रकाशित किया गया. HTML 4.0 की तरह इसमें भी तीन प्रकार हैं, और आखिरी बार इसकी अशुद्धि-सूची 12 मई, 2001 को प्रकाशित की गई.
मई 2000
ISO/IEC 15445:2000[19] ("ISO HTML", HTML 4.01 स्ट्रिक्ट पर आधारित) को एक ISO/IEC अंतर्राष्ट्रीय मानक के रूप में प्रकाशित किया गया.

2008 के मध्य तक, HTML 4.01 और ISO/IEC 15445:2000, HTML के सबसे नए संस्करण हैं. XML-आधारित भाषा XHTML के सामानांतर विकास ने W3C के HTML कार्य समूह को २००० के प्रारंभ और मध्य में व्यस्त कर दिया.

ड्राफ़्ट
अक्टूबर 1991
HTML टैग्स ,[4] बारह HTML टैगों को सूचीबद्ध करने वाले एक अनौपचारिक CERN प्रलेख का सार्वजनिक तौर पर पहली बार उल्लेख किया गया. नवंबर 1992.
जुलाई 1993
हाइपरटेक्स्ट मार्कअप लैंग्वेज[20] को IETF द्वारा एक इंटरनेट-ड्राफ्ट (मानक के लिए एक कच्चे प्रस्ताव) के रूप में प्रकाशित किया गया. इसका समापन जनवरी 1994 में हुआ.
नवंबर 1993
HTML + को IETF द्वारा एक इंटरनेट-ड्राफ्ट के रूप में प्रकाशित किया गया और यह हाइपर टेक्स्ट मार्कअप लैंग्वेज ड्राफ्ट के लिए एक प्रतिस्पर्धी प्रस्ताव था. इसका समापन मई 1994 में हुआ.
अप्रैल 1995 (मार्च 1995 में लिखित)
HTML 3.0[21] को IETF के मानक के रूप में प्रस्तावित किया गया था, लेकिन बिना आगे की कार्रवाई के ही प्रस्ताव पांच महीने बाद समाप्त हो गया. इसमें रेग्गेट के HTML + प्रस्ताव के समान ही, टेबल के लिए समर्थन, आंकड़ों के आसपास पाठ्य का प्रवाह, और जटिल गणितीय फ़ार्मुलों के प्रदर्शन जैसी कई क्षमताएं शामिल थीं.[22]

W3C के अपने एरेना ब्राउज़र में एक निरूपण प्रदर्शित हुआ. कई कारणों से HTML 3.0 सफल नहीं हो पाया. ब्राउज़र विकास की गति, साथ ही इच्छुक पार्टियों की संख्या ने IETF के संसाधनों को पीछे छोड़ दिया था.[12] नवनिर्मित-W3C के लक्ष्यों के विपरीत, जिसने तार्किक संरचना के वर्णन तक HTML को सीमित करना चाहा था, नेटस्केप ने HTML के उन तत्वों को लागू करना जारी रखा, जिनमें प्रलेख का आभासी प्रदर्शन निर्दिष्ट था.[23][24] माइक्रोसॉफ्ट ने, जो उस समय नवागंतुक था, अपने स्वयं के टैग बना कर, संगतता के लिए नेटस्केप के तत्वों को लागू करते हुए और W3C के कास्केडिंग स्टाइल शीट जैसे लक्षणों को समर्थन देते हुए हर तरफ़ से व्यवहृत किया.[12]

जनवरी 2008
HTML5[25] को W3C द्वारा एक कार्यकारी ड्राफ्ट के रूप में प्रकाशित किया गया था.

हालांकि इसका सिंटेक्स SGML जैसा लगता है, पर HTML 5 ने SGML अप्लिकेशन की तरह दिखने का कोई प्रयास नहीं किया, और XML-आधारित XHTML 5 क्रमबद्धता के एक विकल्प के साथ अपने स्वयं की "HTML" क्रमबद्धता को स्पष्टतया परिभाषित किया.[26]

XHTML संस्करण

XHTML, एक अलग भाषा है, जिसकी शुरूआत XML 1.0 के प्रयोग द्वारा HTML 4.01 के पुनर्निर्माण के रूप में हुई. इसका विकास अभी जारी है:

  • XHTML 1.0,[27] 26 जनवरी, 2000 को ३ की सिफ़ारिश के रूप में प्रकाशित हुई, और 1 अगस्त, 2002 को संशोधन के बाद पुनः प्रकाशित हुई. इसमें, मामूली प्रतिबंधों के साथ, XML में पुनर्निर्मित किए गए HTML 4.0 और 4.01 के जैसे ही तीन प्रकार हैं.
  • XHTML 1.1,[28] 31 मई, 2001 को W3C सिफारिश के रूप में प्रकाशित हुई. यह XHTML 1.0 स्ट्रिक्ट पर आधारित है, पर इसमें मामूली परिवर्तन भी शामिल है, इसे अनुकूलित किया जा सकता है, और यह 10 अप्रैल, 2001 को W3C सिफारिश के रूप में प्रकाशित, XHTML के नियमन से मॉड्यूलों का उपयोग करके पुनर्निर्मित हुआ.
  • XHTML 2.0,[29] अभी भी W3C कार्यकारी ड्राफ्ट है. W3C ने घोषणा की थी कि 2009 के अंत तक XHTML 2 समूह काम करना बंद कर देगा.[30] कोई XHTML 2.0 मानक नहीं होगा.XHTML 1.x के साथ XHTML 2.0 मेल जमता नहीं है, और इसलिए XHTML 1.x के अद्यतन की बजाय इसे XHTML-प्रेरित नवीन भाषा कहना ज्यादा सही होगा.
  • XHTML5 को, जो XHTML 1.x का अद्यतन रूप है, अब HTML5 के साथ HTML5 ड्राफ्ट में परिभाषित किया जा रहा है.[31]

HTML मार्कअप

HTML मार्कअप में एलिमेंट्स (और उनके एट्रीब्यूट ), शब्द-आधारित डाटा प्रकार , और कैरेक्टर रेफ़रेन्स एवं एनटिटी रेफ़रेन्स सहित कई प्रमुख घटक शामिल हैं.डॉक्युमेंट टाइप डिक्लरेशन एक और महत्वपूर्ण घटक है, जो डॉक्युमेंट टाइप डेफ़िनिशन को निर्दिष्ट करता है. HTML 5 के अनुसार, किसी डॉक्युमेंट टाइप डेफ़िनिशन को निर्दिष्ट करने की जरूरत नहीं होगी एवं केवल ले-आउट मोड का निर्धारण होगा http://www.w3.org/2008/Talks/04-24-smith/index.html.

हैलो वर्ल्ड प्रोग्राम को, जो प्रोग्रामिंग भाषाओं, स्क्रिप्टिंग भाषाओं और मार्कअप भाषाओं की तुलना करने के लिए नियोजित एक आम कंप्यूटर प्रोग्राम है, HTML में 9 लाइनों के कोड से बनाया गया है, हालांकि लाइन ब्रेक वैकल्पिक हैं:

<!DOCTYPE html>
<html>
 <head>
 <title> Hello HTML </title>
 </head>
 <body>
 <p>Hello World </p>
 </body>
</html>

यह डॉक्युमेंट टाइप डिक्लरेशन HTML5 प्रारूप में है.

यदि <!DOCTYPE> डिक्लरेशन शामिल नहीं है, तो ले-आउट मोड अपने आप "quirks mode" हो जाता है.[32]

तत्त्व

अधिक विस्तृत विवरणों के लिए देखें HTML एलिमेंट्स.

HTML एलिमेंट्स HTML मार्कअप के लिए आधारभूत घटक हैं. एलिमेंट के दो आधारभूत गुण: एट्रीब्यूट और कंटेंट है. प्रत्येक एलिमेंट के एट्रीब्यूट और प्रत्येक एलिमेंट के कंटेंट में कुछ प्रतिबंध होते हैं, जिनका HTML प्रलेख के सही होने के लिए अनुसरण किया जाना चाहिए. सामान्यतः एलिमेंट में एक स्टार्ट टैग होता है (जैसे- <element-name>) और एक एंड टैग होता है (जैसे- </element-name>). एलिमेंट के एट्रीब्यूटों को स्टार्ट टैग में शामिल करते हैं और कंटेंट को टैग्स के बीच में रखते हैं. <element-name attribute="value">Content</element-name> कुछ एलिमेंट जैसे- <br> में कोई भी कंटेंट नहीं है एवं इसमें एक क्लोसिंग टैग नहीं होना चाहिए. HTML में इस्तेमाल किए जाने वाले मार्कअप एलिमेंटों के विभिन्न प्रकार नीचे सूचीबद्ध हैं.

स्ट्रक्चरल मार्कअप, पाठ्य के उद्देश्य का वर्णन करती है. उदाहरण के लिए, <h2>Golf "गोल्फ़" को एक दूसरे-स्तर के शीर्षक के रूप में स्थापित करती है, जिसे इस खंड की शुरुआत में "HTML मार्कअप" की तरह ही ब्राउज़र में प्रतिपादित किया जाएगा.स्ट्रक्चरल मार्कअप, किसी भी विशिष्ट प्रतिपादन को निरूपित नहीं करती है, लेकिन अधिकतर वेब ब्राउज़रों में तत्व संरूपण के लिए मानकीकृत डिफ़ॉल्ट शैली होती है. पाठ्य को आगे कास्केडिंग स्टाइल शीट(CSS) के साथ स्टाइल किया जा सकता है.

प्रेसेंटेशनल मार्कअप, अपने फ़ंक्शन की परवाह न करके पाठ्य के स्वरूप को अंकित करती है. उदाहरण के लिए boldface यह दर्शाता है कि विज़ुअल आउटपुट डिवाइस "boldface" को गहरे पाठ्य में प्रस्तुत करना चाहिए, लेकिन ऐसा कर पाने में अक्षम उपकरणों के बारे में कोई संकेत नहीं देता कि (जैसे- श्रव्य उपकरण जो पाठ्य को जोर से पढ़ते हैं) उन्हें क्या करना चाहिए. <b>bold और <i>italic दोनों के मामले में कुछ तत्व हैं, जो आम तौर पर आभासी प्रदर्शन में समान हैं परन्तु स्वभाव से ज़्यादा सेमेंटिक हैं, अर्थात् क्रमशः <strong>strong emphasis और <em>emphasis.यह देखना आसान है कि कैसे एक श्रव्य प्रयोक्ता एजेंट, बाद के दो तत्वों की व्याख्या करता है. तथापि, वे अपने प्रस्तुतिकरण प्रतिरूपों के समान नहीं है: उदाहरण के लिए एक पुस्तक के नाम पर जोर देना एक स्क्रीन-पाठक के लिए अवांछनीय होगा, लेकिन स्क्रीन पर उक्त नाम तिरछा हो जाएगा. अधिकांश प्रेसेंटेशनल मार्कअप तत्व, CSS आधारित स्टाइल डिजाईन के समर्थन में HTML 4.0 विनिर्देशन के अधीन हटा दिए गए हैं.

हाइपरटेक्स्ट मार्कअप एक प्रलेख के हिस्सों को अन्य प्रलेख से जोड़ता है. XHTML 1.1 संस्करण तक के HTML में पाठ्य के प्रवाह में हाइपरलिंक बनाने के लिए एक एंकर तत्व के प्रयोग की आवश्यकता होती है: <a>Wikipedia तथापि, एक सही URL पर href एट्रीब्यूट को सेट करना जरूरी है, उदाहरण के तौर पर HTML मार्कअप, <a href="http://en.wikipedia.org/">Wikipedia "विकिपीडिया" शब्द को हाइपरलिंक के रूप में दर्शाएगा.चित्र को जोड़ने के लिए, एंकर टैग निम्नलिखित सिंटेक्स का प्रयोग करता है: <a href="url"><img src="image.gif" alt="alternative text" width="50" height="50"></a> <img <a href="url"><img src="image.gif" alt="alternative text" width="50" height="50"></a>

एट्रीब्यूट

एक तत्व के अधिकांश एट्रीब्यूट "=" द्वारा विभक्त नाम-मान के जोड़े के रूप में होते हैं, एवं तत्व के नाम के बाद तत्व के स्टार्ट टैग के भीतर लिखे होते हैं.मान को एक या दोहरे उद्धरण में संलग्न किया जा सकता है, जबकि कुछ निश्चित अक्षरों वाले मान को HTML में बिना उद्धरण के ही छोडा जा सकता है (लेकिन XHTML में नहीं).[33][34] एट्रीब्यूट् के मानों को उद्धरण के बिना छोड़ना असुरक्षित समझा जाता है.[35] नाम-मान जोड़े के एट्रीब्यूट के विपरीत, कुछ एट्रीब्यूट् ऐसे हैं जो केवल तत्व के स्टार्ट टैग में अपनी उपस्थिति द्वारा तत्व को प्रभावित करते हैं.[4] (जैसे img तत्व के लिए ismap एट्रीब्यूट् [36]).

अधिकांश तत्व, कई एट्रीब्यूटों में से किसी का भी इस्तेमाल कर सकते हैं.

  • id एट्रीब्यूट्, तत्व के लिए एक प्रलेख-व्यापी अद्वितीय अभिज्ञापक प्रदान करता है. इसे स्टाइल-शीटों द्वारा प्रस्तुतिकरण लक्षण प्रदान करने के लिए इस्तेमाल किया जा सकता है, ब्राउज़रों द्वारा विशिष्ट तत्व पर ध्यान केन्द्रित करने के लिए, या स्क्रिप्टों द्वारा विषय-सामग्री या तत्वों की प्रस्तुति में परिवर्तन करने के लिए. पेज के URL में संलग्न, यह तत्व के लिए एक विश्वव्यापी-अद्वितीय अभिज्ञापक प्रदान करता है; विशिष्ट रूप से पेज का एक उप-खंड. उदाहरण के लिए, http://en.wikipedia.org/wiki/HTML#Attributes में ID "एट्रीब्यूट्".
  • class एट्रीब्यूट् समान तत्वों को वर्गीकृत करने का एक तरीका प्रदान करता है. इसे सिमेंटिक या प्रस्तुति प्रयोजनों के लिए इस्तेमाल किया जा सकता है.सिमेंटिक के तौर पर, उदहारणतः वर्गों को माईक्रोफॉर्मेट में प्रयोग जाता है प्रस्तुति के तौर पर, उदाहरणतः एक HTML प्रलेख, class="notation" संकेत का प्रयोग यह बताने के लिए कर सकता है कि उक्त वर्ग मान के सभी तत्व प्रलेख के मुख्य पाठ्य के अधीनस्थ हैं.ऐसे तत्व एकत्रित होकर, HTML स्रोत में प्रदर्शित हो रहे स्थान के बजाय पेज के फ़ुट नोट के रूप में प्रस्तुत हो सकते हैं.
  • एक लेखक किसी विशिष्ट तत्व के लिए style नॉन-एट्रीब्यूट्ल कोड के प्रस्तुतिकरण लक्षण का प्रयोग कर सकता है.एक स्टाइल-शीट के साथ तत्व का चयन करने के लिए तत्व के id और class एट्रीब्यूट् का प्रयोग करना एक बेहतर अभ्यास माना जाता है, यद्यपि कभी-कभी यह स्टाइल गुणों वाले साधारण तदर्थ अनुप्रयोग के लिए बहुत बोझिल हो सकता है.
  • title एट्रीब्यूट् का प्रयोग एक तत्व में उप-पाठ्य विवरण को संलग्न करने के लिए किया जाता है. अधिकांश ब्राउज़रों में यह एट्रीब्यूट् उस रूप में प्रदर्शित होता है, जिसे अक्सर Tooltip के रूप में संदर्भित किया जाता है

संकेताक्षर तत्व, abbr का उपयोग इन विभिन्न एट्रीब्यूटों को प्रदर्शित करने के लिए किया जा सकता है:

<abbr id="anId" class="aClass" style="color:blue;" title="Hypertext Markup Language">HTML</abbr>

यह उदाहरण HTML के रूप में प्रदर्शित होता है; अधिकांश ब्राउज़रों में, संक्षिप्त नाम पर कर्सर इंगित करने से शीर्षक पाठ्य "हाइपर टेक्स्ट मार्कअप लैंग्वेज" प्रर्दशित होता है.

अधिकांश तत्व, भाषा संबंधी एट्रीब्यूटों lang और dir का भी इस्तेमाल कारते हैं.

कैरेक्टर और एंटिटी संदर्भ

4.0 संस्करण के अनुसार HTML, 252 कैरेक्टर एंटिटी संदर्भ और 1.114.050 संख्यात्मक कैरेक्टर संदर्भ के सेट को परिभाषित करता है, जो दोनों ही अलग-अलग कैरेक्टरों को, शाब्दिक तौर पर लिखने की बजाय सरल मार्कअप के माध्यम से लिखे जाने की अनुमति देते है. एक शाब्दिक अक्षर और उसके मार्कअप प्रतिरूप को बराबर माना जाता है और वे समरूप होते हैं.

इस तरह से कैरेक्टर "पलायन" की क्षमता < और & कैरेक्टर (जब क्रमशः &lt; और &amp; के रूप में लिखे हों) को मार्कअप की बजाय कैरेक्टर आंकडा के रूप में व्याख्यायित किये जाने की अनुमति देती है. उदाहरण के लिए, अक्षर < टैग की शुरुआत का और & सामान्य रूप से एक कैरेक्टर एंटिटी संदर्भ या संख्यात्मक कैरेक्टर संदर्भ की शुरूआत का संकेत करता है; इसे &amp; या &#x26; या &#38; के रूप में लिखना, & को तत्व की सामग्री या एट्रीब्यूट्स के मान को शामिल किये जाने की अनुमति देता है; दोहरे-उद्धरण कैरेक्टर (") का इस्तेमाल जब एट्रीब्यूट् के मान को उद्धृत करने के लिए हों, तब उसका &quot; या &#x22; या &#34; की तरह पलायन भी किया जाना चाहिए, जब वह एट्रीब्यूट्स मान के अंदर दिखता है.एकल-उद्धरण कैरेक्टर (') का इस्तेमाल जब एट्रीब्यूट् के मान को उद्धृत करने के लिए हो, तब उसका &#x27; &#39; के रूप में (XHTML प्रलेखों के अलावा अन्य में &apos; के रूप में पलायन नहीं होना चाहिए), जब वह एट्रीब्यूट्स मान के अंदर दिखता है. तथापि, अक्सर प्रलेख लेखकों ने इन कैरेक्टरों के पलायन की आवश्यकता को अनदेखा किया है, तब से उस आशय की पुष्टि करने के लिए अनुवर्ती पाठ्य के प्रकट होने के समय, उनके साथ मार्कअप की तरह ही व्यव्हार करते हुए, ब्राउज़रों ने बहुत क्षमाशील होने की कोशिश की है.

पलायन उन कैरेक्टरों को भी एलिमेंट और एट्रीब्यूट् की सामग्री के भीतर प्रतिनिधित्व करने की अनुमति देती है, जो कि आसानी से टाइप नहीं किये जा सकते या जो प्रलेख के कैरेक्टर एनकोडिंग में उपलब्ध ही नहीं हैं.उदाहरण के लिए, पैने उच्चारण वाले e, एक कैरेक्टर (é) को, जो कि विशेष तौर पर पश्चिमी यूरोपीय की-बोर्ड पर ही मिलता है, किसी भी HTML प्रलेख में, एंटिटी संदर्भ &eacute; या संख्यात्मक सन्दर्भों &#233; या &#xE9; के रूप में लिखा जा सकता है. इन संदर्भों वाले कैरेक्टर (जो & , the &, the ;, और eacute के सभी अक्षर इत्यादि हैं) सभी की-बोर्ड पर उपलब्ध हैं, और उन्हें कैरेक्टर एनकोडिंग में समर्थन भी प्राप्त है, जबकि अक्षर é को नहीं है.

डाटा के प्रकार

HTML, एलिमेंट कंटेंट के लिए कई प्रकार के आंकडा प्रकार जैसे- स्क्रिप्ट आंकडा और स्टाइल-शीट आंकडा तथा ID, नाम, URI, नंबर, लंबाई की इकाइयों, भाषाओं, मीडिया विवरणकों, रंग, कैरेक्टर एनकोडिंग, तिथि और समय इत्यादि समेत एट्रिब्यूट मानों के लिए, कई प्रकारों को परिभाषित करती है.ये सभी आंकडा प्रकार, कैरेक्टर आंकडे के विशिष्टीकरण हैं.

प्रलेख प्रकार घोषणा

HTML प्रलेखों को एक प्रलेख प्रकार घोषणा (अनौपचारिक रूप से, एक "doctype") के साथ शुरू करना आवश्यक हैं. ब्राउज़रों में, doctype का कार्य प्रतिपादन मोड को इंगित करना है- खास कर quirks मोड से बचने के लिए.

इस doctype का मूल उद्देश्य डॉक्युमेंट टाइप डिक्लरेशन (DTD) पर आधारित वेलिडेशन को SGML उपकरण के साथ समर्थकारी बनाना था. DTD, जिससे DOCTYPE संदर्भित है, मशीन-पठनीय व्याकरण शामिल है जो इस DTD के अनुरूप प्रलेख के लिए अनुज्ञेय एवं निषिद्ध सामग्री को उल्लिखित करती है. हालांकि ब्राउज़र DTD को नहीं पढ़ते हैं.HTML5 वेलिडेशन DTD-आधारित नहीं है, इसलिए HTML5 में doctype, DTD से संदर्भित नहीं है.

HTML 4 doctype का एक उदाहरण:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

संरूपण को कास्केडिंग स्टाइल शीट, और span और div टैगों पर छोड़ते हुए, यह घोषणा HTML 4.01 की स्ट्रिक्ट DTD को संदर्भित करती है, जिसमें <font> जैसे प्रस्तुतिकरण तत्व नहीं हैं.SGML आधारित वेलीडेटर DTD को प्रलेख की सही पद-व्याख्या और वेलिडेशन को पूरा करने के लिए पढ़ते हैं.आधुनिक ब्राउज़रों में, quirks मोड के विरोध के लिए HTML 4.01 स्ट्रिक्ट doctype, CSS के लिए स्टैण्डर्ड ले-आउट मोड को सक्रिय कर देती है.

इसके अलावा, HTML 4.01 परिवर्ती और फ्रेम सेट DTD प्रदान करती है. परिवर्ती DTD में चाहा गया था कि स्ट्रिक्ट DTD में किए गए बदलाव धीरे-धीरे हों, जबकि फ्रेमसेट DTD उन प्रलेखों के लिए अभिप्रेत था जिनमें फ़्रेम हों.

सिमेंटिक HTML

"सिमेंटिक HTML" कहा जाने वाला कोई आधिकारिक विनिर्देश नहीं है http://www.google.com/search?client=firefox-a&rls=org.mozilla%3Aen-GB%3Aofficial&channel=s&hl=en&q=Semantic+HTML+-wikipedia&btnG=Google+Search. सिमेंटिक HTML ऐसे प्रलेख बनाने के अभ्यास को संदर्भित करती है जिसमें अर्थ की प्रस्तुति से संबंधित बिना किसी सन्दर्भ के ही, केवल लेखक द्वारा अभीष्ट अर्थ शामिल हो.यह प्रस्तुति और सामग्री के अलगाव के विचार का हिस्सा है. उदाहरण के लिए, प्रबलता तत्व  और तिरछा तत्व  डिफ़ॉल्ट में कार्यात्मक रूप से समान हैं, लेकिन उनके दो अलग अर्थ हैं. सिमेंटिक HTML में मार्कअप के पीछे का अर्थ महत्वपूर्ण है.

CSS का प्रयोग विशिष्ट तौर पर सिमेंटिक HTML में प्रस्तुतिकरण प्रभावों के निर्माण के लिए किया जाता है. CSS के द्वारा, एक डिज़ाइनर उपयुक्त सिमेंटिक मार्कअप के साथ सामग्री बना सकता है और फिर CSS का उपयोग अपने मार्कअप के स्वरूप में परिवर्तन करने के लिए कर सकता है. विचार यह है कि कोड में प्रस्तुतिकरण तत्वों (जैसे तिरछे और गहरे अक्षरलेख) का उपयोग नहीं किया जाना चाहिए, और यह कि उद्धरण की तरह प्रस्तुतिकरण तत्वों के साथ कुछ आशय भी संलग्न होना चाहिए.

सिमेंटिक HTML का लाभ यह है कि सही मार्कअप के लगातार प्रयुक्त होने तक पाठ्य की प्रस्तुति भी लगातार होगी.इसके अलावा, यह मात्र स्टाइल-शीट में संशोधन द्वारा तथा पाठ्य को एक साईट से दूसरे तक स्थानांतरित करने में सक्षम होते हुए, प्रस्तुति को आसानी से बदलने की अनुमति देता है.

मुख्य हानि यह है कि HTML हर कल्पनीय विवरण या आशय के निरूपण के लिए पर्याप्त मार्कअप टैग शामिल नहीं करता है. वैसे तो, लोग अपने अभीष्ट आशय के लिए, आम तौर पर पाठ्य को सही तरह से मार्कअप करने लिए पूर्वनिर्धारित वर्गों के सेट या ID के साथ डिविज़न (

) टैग का इस्तेमाल करते हैं. अगर डिज़ाइनर के पास ऐसे खंडों या आशयों की भरमार है जो कि अच्छी तरह से HTML की मार्कअप के साथ फिट नहीं है, तो वे बहुत से डिविज़न (
) टैगों का उपयोग करने के लिए मजबूर हो सकते हैं, जोकि आसानी से कोड को निस्तेज कर सकता है.

HTML का अंतरण

HTML प्रलेखों को उसी माध्यम से अंतरित किया जा सकता है जिससे अन्य कंप्यूटर-फाइल को किया जाता है, हालांकि इन्हें अक्सर वेब-सर्वर से HTTP के द्वारा या ई-मेल के द्वारा अंतरित किया जाता है.

HTTP

वर्ल्ड वाइड वेब मुख्यतः HTML प्रलेखों से बना है, जोकि हाइपरटेक्स्ट ट्रान्सफर प्रोटोकॉल (HTTP) का उपयोग करते हुए वेब सर्वरों से वेब ब्राउज़रों पर संचारित होते हैं.तथापि, HTML के अतिरिक्त HTTP का उपयोग चित्रों, ध्वनि, और अन्य सामग्रियों को प्रस्तुत करने के लिए होता है. वेब ब्राउज़र को यह जानने के लिए कि कैसे प्रत्येक प्रलेख का नियंत्रण किया जाना है, प्रलेखों के साथ अन्य जानकारी भी संचारित होती है.इस मेटाडाटा में आम तौर पर MIME type (जैसे text/html या application/xhtml+xml) और कैरेक्टर एनकोडिंग शामिल होते हैं (HTML में कैरेक्टर एनकोडिंग देखें).

आधुनिक ब्राउज़रों में, HTML प्रलेख के साथ भेजे जाने वाले MIME प्रकार, प्रलेख की प्रारंभिक व्याख्या को प्रभावित कर सकते हैं. XHTML के साथ भेजे जाने वाले MIME प्रकार प्रलेख का XML में सुनिर्मित होना अपेक्षित होता है, और सिंटेक्स में त्रुटियों के कारण ब्राउजर इसे दर्शाने में विफल हो सकता है. HTML MIME प्रकार के साथ भेजने पर वही प्रलेख सफलतापूर्वक प्रदर्शित हो सकता है, क्योंकि कुछ ब्राउज़र HTML के साथ अधिक उदार होते हैं.

W3C सिफारिशों में बताया गया है कि सिफारिशों के परिशिष्ट-सी में दिखाए गए दिशानिर्देशों का अनुसरण करने वाले XHTML 1.0 प्रलेखों को प्रत्येक MIME प्रकार से लेबल किया जा सकता है.[37] वर्तमान XHTML 1.1 कार्यकारी ड्राफ्ट में भी कहा गया है कि XHTML 1.1 प्रलेखों[38] को प्रत्येक MIME प्रकार के साथ लेबल होना चाहिए.[39]

HTML ई-मेल

अधिकांश ग्राफ़िकल ई-मेल ग्राहकों को संरूपण और सिमेंटिक मार्कअप प्रदान करने के लिए, HTML (अक्सर अपूर्ण रूप से परिभाषित) के उप समुच्चयों का उपयोग करने की अनुमति होती है, जोकि सादे पाठ्य में उपलब्ध नहीं है.इसमें रंगीन शीर्षक, उभरे हुए और उद्धृत पाठ्य, इन-लाइन चित्र और रेखा-चित्र जैसी मुद्रण-सज्जा जानकारी शामिल हो सकती है.ऐसे कई आश्रित दोनों को शामिल कर सकते हैं, जैसे GUI एडीटर को HTML ई-मेल संदेश तैयार करने के लिए और वापस सौंपने वाले इंजन को प्रदर्शन के लिए.HTML के ई-मेल में HTML का प्रयोग संगतता के मुद्दों, यथा यह छद्म-वेष फ़िशिंग हमलों में मदद कर सकता है, स्पैम फिल्टरों को भ्रमित कर सकता है, और संदेश का आकार सादे पाठ्य की अपेक्षा बड़ा होता है आदि की वजह से विवादास्पद है.

नामकरण परंपरा

HTML वाली फ़ाइलों के लिए आम फ़ाइल एक्सटेंशन html है.इसके लिए आम संक्षिप्तीकरण .htm है जिसकी शुरूआत, तीन अक्षरों के सीमित एक्सटेंशन वाले प्रारंभिक ऑपरेटिंग सिस्टमों और फाइल सिस्टमों जैसे- DOS और FAT से हुई थी.

HTML अनुप्रयोग

HTML अनुप्रयोग (HTA; फाइल एक्सटेंशन ".hta"), एक माइक्रोसॉफ्ट विन्डोज़ अनुप्रयोग है, जो अनुप्रयोग के ग्राफ़िकल अंतरफलक प्रदान करने के लिए एक ब्राउज़र में HTML और गत्यात्मक HTML का प्रयोग करती है.एक नियमित HTML फ़ाइल, वेब ब्राउज़रों के साथ संचार तथा वेबपेज बिम्बों एवं साइट कुकीज़ में जोड़-तोड़ करते हुए, केवल वेब-सर्वर के सुरक्षा मॉडल तक ही सीमित होती है. HTA, पूर्ण विश्वसनीय अनुप्रयोग की तरह काम करती है और इसलिए इसके पास सृजन/ संपादन/ फ़ाइलों और विंडोज रजिस्ट्री प्रविष्टियों को हटाने जैसे विशेषाधिकार हैं. ब्राउजर के सुरक्षा मॉडल के बाहर ऑपरेट होने के कारण HTAs का निष्पादन HTTP के द्वारा नहीं हो सकता, परन्तु इसे (एक EXE फ़ाइल की तरह) डाउनलोड करके, स्थानीय फाइल सिस्टम के द्वारा निष्पादित किया जा सकता है.

HTML के वर्तमान प्रकार

सूत्रपात के बाद से ही, HTML और इससे संबद्ध प्रोटोकॉलों को अपेक्षाकृत जल्दी स्वीकृति मिल गई. तथापि, भाषा के शुरूआती वर्षों में कोई स्पष्ट मानक स्थापित नहीं थे. जबकि HTML के रचनाकारों ने इसकी कल्पना, मूल रूप से प्रस्तुति विवरण से विहीन सिमेंटिक लैंग्वेज के रूप में की थी http://www.w3.org/History/19921103-hypertext/hypertext/WWW/MarkUp/HTMLConstraints.html, अधिकांशतः विभिन्न ब्राउज़र विक्रेताओं द्वारा चालित एवं व्यावहारिक उपयोगों द्वारा, बहुत से प्रस्तुतिकरण तत्व और एट्रीब्यूट् भाषा में आ गए. HTML को प्राप्त नवीनतम मानक, किसी समय में भाषा के अराजक विकास से उबरने http://ei.cs.vt.edu/~wwwbtb/book/chap13/who.html और सार्थक एवं अच्छी प्रस्तुति वाले प्रलेखों के लिए एक तर्कसंगत आधार बनाने के प्रयासों के बारे में बताते है. HTML की सिमेंटिक लैंग्वेज के रूप में अपनी भूमिका में वापसी के लिए, W3C ने प्रस्तुति के बोझ को कम करने के लिए CSS और XSL जैसी स्टाइल भाषाओं को विकसित किया.संयोजन में, HTML विनिर्देश धीरे-धीरे प्रस्तुतिकरण तत्वों के नियंत्रण में चले गए.

HTML के विभिन्न प्रकारों में भेद करते हुए संप्रति दो धुरी निर्दिष्ट हैं: SGML-आधारित HTML बनाम XML-आधारित HTML (XHTML के रूप में) एक धुरी पर, और सख्त बनाम परिवर्ती (ढीले) बनाम फ्रेमसेट दूसरी धुरी पर.

SGML-आधारित बनाम XML-आधारित HTML

नवीनतम HTML विशिष्टताओं में एक अंतर, SGML-आधारित विनिर्देश एवं XML-आधारित विनिर्देश के बीच का भेद है. पारंपरिक परिभाषा से स्पष्ट रूप से भेद करने के लिए, XML-आधारित विनिर्देश को आम तौर पर XHMTL कहा जाता है; लेकिन XHTML-निर्दिष्ट HTML में भी 'html' मूल तत्व नाम के रूप में जारी है. W3C ने अधिक जटिल SGML पर XML की परिमितताओं में कार्य करने की आवश्यकता वाले मामलों के अतिरिक्त, XHTML 1.0 का XHTML 4.01 के समान होना चाहा था.चूंकि XHTML और HTML में निकट संबंध हैं, वे कभी-कभी समानांतर प्रलेखित होते हैं.ऐसी हालात में, कुछ लेखक दो नामों को (X)HTML या X(HTML) के रूप में मिला देते हैं.[40]

HTML 4.01 की तरह, XHTML 1.0 में भी तीन उप-विनिर्देश हैं: स्ट्रिक्ट, लूज़ और फ्रेमसेट.

प्रलेख संबंधी विभिन्न प्रारंभिक घोषणाओं से अलग, HTML 4.01 और XHTML 1.0 प्रलेख के बीच के अंतर - प्रत्येक तदनुरूप DTDs में — बड़े पैमाने पर वाक्यात्मक हैं. HTML के अंतर्निहित सिंटेक्स, वैकल्पिक खुलने या बंद होने वाले टैगों के साथ तत्व, और बिना बंद-टैग वाले EMPTY तत्वों जैसे कई शॉर्टकट की अनुमति देते है, XHTML में इसकी अनुमति नहीं है. इसके विपरीत, XHTML में सभी तत्वों के लिए एक खुलने वाला टैग या एक बंद-टैग ज़रूरी होता है.हालांकि, XHTML भी एक नया शॉर्टकट प्रस्तावित करती है:
की तरह टैग के अंत से पहले एक स्लैश शामिल करके एक XHTML टैग को एक ही टैग के भीतर खोला या बंद किया जा सकता है.इस आशुलिपि के परिचय से, जिसका उपयोग HTML 4.01 के लिए SGML घोषणा में उपयोग नहीं किया जाता है, प्रारंभिक सॉफ्टवेयर भ्रमित हो सकते हैं जोकि इस नई परिपाटी से अपरिचित है.इसको फिक्स करने के लिए, टैग को बंद करने से पहले एक खाली-स्थान छोड़ना होता है जैसे:
.[41]

HTML और XHTML के बीच के सूक्ष्म अंतर को समझने के लिए, एक सही और सुनिर्मित XHTML 1.0 प्रलेख के रूपांतर पर विचार करें जो सही HTML 4.01 प्रलेख में परिशिष्ट-सी में जुडा है (नीचे देखें).इसे अनूदित करने के लिए निम्न चरणों की आवश्यकता होती है:

  1. एक तत्व के लिए भाषा को XHTML xml:lang ऐट्रीब्यूट की बजाय एक lang एट्रीब्यूट के साथ निर्दिष्ट किया जाना चाहिए .XHTML , XML में सन्निहित भाषा-परिभाषी कार्यशीलता एट्रीब्यूट का उपयोग करता है.
  2. XML नेम-स्पेस (xmlns=URI) को हटायें . HTML में नेम-स्पेस के लिए कोई सुविधा नहीं है.
  3. प्रलेख प्रकार परिभाषा को XHTML 1.0 से HTML 4.01 में बदल देता है (अधिक विवरण के लिए DTD खंड देखें).
  4. यदि उपस्थित है, XML घोषणा को हटा दें . (आमतौर पर यह है: <?xml version="1.0" encoding="utf-8"?>
  5. प्रलेख के MIME प्रकार का text/html में सेट होना सुनिश्चित करता है . HTML और XHTML दोनों के लिए, यह सर्वर के द्वारा भेजे HTTP शीर्षक Content-Type से आता है.
  6. XML खाली-तत्व सिंटेक्स को HTML स्टाइल तत्व सिंटेक्स में बदलता है (
    को
    में).

ये मुख्य परिवर्तन है जो प्रलेख को XHTML 1.0 से HTML 4.01 में अनूदित करने के लिए आवश्यक है. HTML से XHTML में अनुवाद करने के लिए किसी छोड़े गए खुले या बंद-टैगों को शामिल करने की भी आवश्यकता होगी. HTML या XHTML किसी में भी कोडिंग हो, HTML प्रलेख में, कौन-सा टैग छोडा जा सकता है यह याद करने की बजाय छोड़े गए वैकल्पिक टैग को शामिल करना हमेशा सर्वश्रेष्ठ होता है

एक सुनिर्मित XHTML प्रलेख, XML के सभी सिंटेक्स की आवश्यकताओं का पालन करता है. एक सही प्रलेख XHTML के लिए सामग्री विनिर्देशन का समर्थन करता है, जो प्रलेख की संरचना का वर्णन करती है.

W3C ने HTML और XHTML के बीच एक आसान अंतरण को सुनिश्चित करने के लिए कई रूढियों की सिफारिश की है (HTML संगतता मार्गनिर्देश देखें). निम्नलिखित चरणों को केवल XHTML 1.0 प्रलेखों में प्रयुक्त किया जा सकता है:

  • किसी भी तत्व निर्दिष्ट भाषा में xml:lang और lang, दोनों एट्रीब्यूट को शामिल करें.
  • खाली-तत्व सिंटेक्स का प्रयोग केवल उन्हीं तत्वों के लिए करें जो HTML में खाली के रूप में निर्दिष्ट हैं.
  • खाली-तत्व टेगों में एक अतिरिक्त स्थान शामिल करें: उदाहरण के लिए
    के बजाय
    .
  • तत्वों के लिए स्पष्ट बंद टेगों को शामिल करें, जो अंतर्वस्तु को अनुमति देते हैं, लेकिन खाली छोडे जाते हैं (उदाहरण के लिए,
    ,
    नहीं).
  • XML घोषणा को छोड़ दें.

W3C की अनुकूलता दिशा-निर्देशों का ध्यान से अनुसरण करके, एक प्रयोक्ता एजेंट को प्रलेख की व्याख्या करने में HTML या XHTML के जैसा सक्षम होना चाहिए. ऐसे प्रलेखों को, जो XHTML 1.0 हैं और जिन्हें इस तरह से अनुकूल बनाया गया है, W3C या तो HTML के रूप में (एक MIME प्रकार text/html के साथ) या XHTML के रूप में (एक MIME प्रकार application/xhtml+xml या application/xml के साथ) प्रस्तुत करता है. XHTML के रूप में प्रतिपादन के समय ब्राउज़रों को एक XML पार्सर का प्रयोग करना चाहिए जो प्रलेख की अंतर्वस्तु को पार्स करने के लिए XML विनिर्देशों का सख्ती से पालन करता है.

परिवर्ती बनाम सख्त

नवीनतम SGML-आधारित विनिर्देश HTML 4.01 और प्रारंभिक XHTML संस्करण में तीन उप-विनिर्देश: सख्त, परिवर्ती (पहले ढीली कही जाती थी), और फ्रेमसेट शामिल हैं. सख्त प्रकार, मानक का सही प्रतिनिधित्व करता है जबकि परिवर्ती और फ्रेमसेट प्रकारों को HTML (HTML 3.2 सहित) के पूर्व संस्करणों से परिवर्तन में सहायता करने के लिए विकसित किया.परिवर्ती और फ्रेमसेट प्रकार प्रदर्शनकारी मार्कअप के लिए अनुमति देते हैं जबकि सख्त प्रकार अति प्रदर्शनकारी मार्कअप के लोप द्वारा स्टाइल शीट के उपयोग को प्रोत्साहित करती है.

प्राथमिक असमानताएं जो परिवर्ती प्रकार को सख्त की बजाय अधिक अनुज्ञाप्रद बनाती हैं (HTML 4 और XHTML 1.0 के सामान अंतर )वे निम्न हैं:

  • एक लूज़र कंटेंट मॉडल
    • इन-लाइन तत्वों और सादा टेक्स्ट (# PCDATA) की body, blockquote, form, noscript और noframes में सीधे अनुमति दी हैं:
  • प्रस्तुतिकरण संबंधी तत्व
    • (u) रेखांकित
    • strike-through (काटना) (s)
    • center
    • font
    • basefont
  • प्रस्तुति संबंधित एट्रीब्यूट
    • body तत्व के लिए background और bgcolor एट्रीब्यूट
    • div, form पैराग्राफ (p), और शीर्षक (h1 ... h6) तत्वों पर align एट्रीब्यूट
    • hr तत्व पर align, noshade, size और width एट्रीब्यूट
    • img और object तत्वों पर align, border, vspace और hspace एट्रीब्यूट
    • legend और caption तत्वों पर align एट्रीब्यूट
    • table तत्व पर align और bgcolor
    • td और th तत्वों पर nowrap, bgcolor width, height
    • tr पर bgcolor एट्रीब्यूट
    • br तत्व पर clear एट्रीब्यूट
    • dl, dir और menu तत्वों पर compact एट्रीब्यूट
    • o1 और ul तत्वों पर type, compact और start एट्रीब्यूट
    • li तत्व पर type और value एट्रीब्यूट
    • pre तत्व पर width एट्रीब्यूट
  • परिवर्ती विनिर्देश में अतिरिक्त तत्व
    • menu सूची (कोई विकल्प नहीं है, यद्यपि बिना क्रम वाली सूची की सिफारिश; XHTML 2.0 विनिर्देश में वापस आ सकती है)
    • dir सूची (कोई विकल्प नहीं है, यद्यपि बिना क्रम वाली सूची की सिफारिश की जाती है)
    • isindex (तत्व के लिए सर्वर-साइड समर्थन की आवश्यकता है और इस विशिष्ट तौर पर प्रलेखों की सर्वर-साइड में जोड़ा जाता है)
    • applet (बिम्ब तत्व के पक्ष में पदावनत)
  • स्क्रिप्ट तत्व पर language एट्रीब्यूट (type एट्रीब्यूट के साथ संभाव्यतः निरर्थक, हालांकि इसे विरासत कारणों से बनाए रखा है)
  • फ़्रेम संबंधित इकाइयां
    • framset तत्व (फ्रेम सेट DTD के लिए मुख्य भाग के स्थान पर प्रयुक्त)
    • frame तत्व
    • iframe
    • noframes
    • anchor, आश्रित-पक्ष इमेज-मैप (imagemap), link, form और base तत्वों पर target एट्रीब्यूट

फ्रेमसेट बनाम परिवर्ती

उपरोक्त परिवर्ती असमानताओं के अलावा, फ्रेमसेट विनिर्देश (चाहे XHTML 1.0 या HTML 4.01) body के साथ frame और वैकल्पिक तौर पर noframes तत्व युक्त frameset रिप्लेसिंग body के साथ एक अलग कंटेंट मॉडल को निर्दिष्ट करता है.

प्रकारों का संक्षिप्त विवरण

जैसा कि इस सूची में दर्शाया गया है, विनिर्देश के लूज़ प्रकार को विरासत का समर्थन करने के लिए बनाए रखा है. हालांकि, प्रचलित गलतफहमियों के विपरीत, XHTML की तरफ बढ़ना इस विरासत समर्थन को हटाने का संकेत नहीं करता है. बल्कि XML में X का मतलब एक्स्टेंसिबल होता है और W3C पूरे विनिर्देश का नियमन करके इसे निरपेक्ष एक्सटेंशन के रूप में प्रारंभ कर रहा है. XHTML 1.0 से XHTML 1.1 की तरफ बढ़ने पर पूरे विनिर्देश का नियमन प्राथमिक उपलब्धि है. HTML का स्ट्रिक्ट संस्करण XHTML 1.1 में आधारभूत XHTML 1.1 विनिर्देश के लिए अनुखंडीय एक्सटेंशन के एक सेट के माध्यम से परिनियोजित किया गया है. इसी तरह, लूज (परिवर्ती) या फ्रेम सेट विनिर्देश चाहने वालों को उसी तरह का विस्तृत XHTML 1.1 समर्थन प्राप्त होगा (विरासत या फ्रेम मॉड्यूलों में अधिकांशतः उपलब्ध).मॉड्यूलीकरण अलग विशेषताओं को उनके अपने समय पर विकसित होने की अनुमति देता है. अतएव उदाहरण के लिए XHTML 1.1 उभरते XML मानकों जैसे- MathML (XML पर आधारित एक प्रस्तुतिकरण सिमेंटिक मैथ लैंग्वेज) और XForms- मौजूदा HTML रूपों को बदलने के लिए एक नई काफी उन्नत वेब-फॉर्म प्रौद्योगिकी के तेज अंतरण की अनुमति देती है.

संक्षेप में, HTML 4.01 विनिर्देश प्रारंभ में SGML पर आधारित एक स्पष्ट लिखित विनिर्देश के अंदर समस्त विभिन्न HTML निष्पादनों के नियंत्रण में थे. XHTML 1.0 ने इस विनिर्देशन को नए XML परिभाषित विनिर्देश के रूप में बदल दिया. इसके बाद, XHTML 1.1, XML के वितान्य प्रकृति का फायदा उठाते हुए पूरे विनिर्देश का मॉड्यूलीकरण कर दिया.XHTML 2.0, एक मानक-मुख्य भाग-आधारित दृष्टिकोण में विनिर्देशन के लिए नई सुविधाएं जोड़ने में पहला कदम होगा.

HTML में हाइपर टेक्स्ट सुविधाओं का न होना

HTML में प्रारंभिक हाइपर टेक्स्ट प्रणालियों में पाई जाने वाली कुछ सुविधाएं जैसे, टाइप लिंक, स्रोत ट्रैकिंग, फेट लिंक आदि का अभाव है.[42] HTML के प्रारंभिक संस्करणों में विद्यमान कुछ हाइपर टेक्स्ट सुविधाओं जैसे लिंक तत्व और इन-ब्राउजर वेब पेज संपादन को भी सर्वाधिक प्रचलित वेब ब्राउज़रों द्वारा हाल तक नजरअंदाज किए गए.

कभी-कभी वेब सेवाओं या ब्राउज़र निर्माताओं द्वारा इन कमियों के उपाय सुझाए जाते हैं. उदाहरण के लिए, wikis और सामग्री प्रबंधन प्रणालियां सर्फ़ करने वालों को उनके द्वारा देखे गए वेब पृष्ठों को संपादित करने की अनुमति देती हैं.

यह भी देखें

संदर्भ

  1. टिम बेर्नेर्स-ली, "सूचना प्रबंधन: एक प्रस्ताव." CERN (मार्च 1989, मई 1990). http://www.w3.org/History/1989/proposal.html
  2. टिम Berners-ली, "डिजाइन मुद्दे" http://www.w3.org/DesignIssues/
  3. टिम बेर्नेर्स-ली, "डिजाइन मुद्दे" http://www.w3.org/DesignIssues/Uses.html
  4. "Tags used in HTML". World Wide Web Consortium. 1992-11-03. अभिगमन तिथि 2008-11-16.
  5. "First mention of HTML Tags on the www-talk mailing list". World Wide Web Consortium. 1991-10-29. अभिगमन तिथि 2007-04-08.
  6. "Index of elements in HTML 4". World Wide Web Consortium. 1999-12-24. अभिगमन तिथि 2007-04-08.
  7. Tim Berners-Lee (1991-12-09). "Re: SGML/HTML docs, X Browser (archived www-talk mailing list post)". अभिगमन तिथि 2007-06-16. SGML is very general. HTML is a specific application of the SGML basic syntax applied to hypertext documents with simple structure.
  8. Raymond, Eric. "IETF and the RFC Standards Process". [[The Art of Unix Programming]]. In IETF tradition, standards have to arise from experience with a working prototype implementation — but once they become standards, code that does not conform to them is considered broken and mercilessly scrapped. …Internet-Drafts are not specifications, and software implementers and vendors are specifically barred from claiming compliance with them as if they were specifications. Internet-Drafts are focal points for discussion, usually in a working group… Once an Internet-Draft has been published with an RFC number, it is a specification to which implementers may claim conformance. It is expected that the authors of the RFC and the community at large will begin correcting the specification with field experience. URL–wikilink conflict (मदद)
  9. "HTML+ Internet-Draft - Abstract". Browser writers are experimenting with extensions to HTML and it is now appropriate to draw these ideas together into a revised document format. The new format is designed to allow a gradual roll over from HTML, adding features like tables, captioned figures and fill-out forms for querying remote databases or mailing questionnaires.
  10. "RFC 1866: Hypertext Markup Language - 2.0 - Acknowledgments". Internet Engineering Task Force. 2005-09-22. अभिगमन तिथि 2007-06-16. Since 1993, a wide variety of Internet participants have contributed to the evolution of HTML, which has included the addition of in-line images introduced by the NCSA Mosaic software for WWW. Dave Raggett played an important role in deriving the forms material from the HTML+ specification. Dan Connolly and Karen Olson Muldrow rewrote the HTML Specification in 1994. The document was then edited by the HTML working group as a whole, with updates being made by Eric Schieler, Mike Knezovich, and Eric W. Sink at Spyglass, Inc. Finally, Roy Fielding restructured the entire draft into its current form.
  11. "RFC 1866: Hypertext Markup Language - 2.0 - Introduction". Internet Engineering Task Force. 2005-09-22. अभिगमन तिथि 2007-06-16. This document thus defines an HTML 2.0 (to distinguish it from the previous informal specifications). Future (generally upwardly compatible) versions of HTML with new features will be released with higher version numbers.
  12. Raggett, Dave (1998). Raggett on HTML 4. अभिगमन तिथि 2007-07-09.
  13. "HTML 3.2 Reference Specification". World Wide Web Consortium. 14-January-1997. अभिगमन तिथि 2008-11-16. |date= में तिथि प्राचल का मान जाँचें (मदद)
  14. "IETF HTML WG". अभिगमन तिथि 2007-06-16. NOTE: This working group is closed
  15. "HTML 4.0 Specification". World Wide Web Consortium. 18-December-1997. अभिगमन तिथि 2008-11-16. |date= में तिथि प्राचल का मान जाँचें (मदद)
  16. Arnoud Engelfriet. "Introduction to Wilbur". Web Design Group. अभिगमन तिथि 2007-06-16.
  17. "HTML 4.0 Specification". World Wide Web Consortium. 24-April-1998. अभिगमन तिथि 2008-11-16. |date= में तिथि प्राचल का मान जाँचें (मदद)
  18. "HTML 4.01 Specification". World Wide Web Consortium. 24 December 1999. अभिगमन तिथि 2008-11-16.
  19. https: / / www.cs.tcd.ie/15445/15445.HTML
  20. Hypertext मार्कअप भाषा: पुनर्प्राप्ति और अंतरपरिवर्तन के लिए पाठ्य सूचना और मेटासूचना का प्रतिनिधित्व
  21. "HTML 3.0 Draft (Expired!) Materials". World Wide Web Consortium. 1995-12-21. अभिगमन तिथि 2008-11-16.
  22. "HyperText Markup Language Specification Version 3.0". अभिगमन तिथि 2007-06-16.
  23. "Extensions to HTML 3.0". Netscape. मूल से 2006-11-13 को पुरालेखित. Netscape remains committed to supporting HTML 3.0. To that end, we've gone ahead and implemented several of the more stable proposals, in expectation that they will be approved. …In addition, we've also added several new areas of HTML functionality to Netscape Navigator that are not currently in the HTML 3.0 specification. We think they belong there, and as part of the standards process, we are proposing them for inclusion.
  24. "Press Release: W3C Publishes Public Draft of CSS2". World Wide Web Consortium. 4 November, 1997 SOPHIA-ANTIPOLIS, FRANCE. अभिगमन तिथि 2008-11-16. |date= में तिथि प्राचल का मान जाँचें (मदद)
  25. "HTML 5". World Wide Web Consortium. 10 June 2008. अभिगमन तिथि 2008-11-16.
  26. "HTML 5, one vocabulary, two serializations". अभिगमन तिथि 2009-02-25.
  27. "XHTML 1.0: The Extensible HyperText Markup Language (Second Edition)". World Wide Web Consortium. 26 January 2000. अभिगमन तिथि 2008-11-16.
  28. "XHTML 1.1 - Module-based XHTML - Second Edition". World Wide Web Consortium. 16 February 2007. अभिगमन तिथि 2008-11-16.
  29. "XHTM 2.0". World Wide Web Consortium. 26 July 2006. अभिगमन तिथि 2008-11-16.
  30. "XHTML 2 Working Group Expected to Stop Work End of 2009, W3C to Increase Resources on HTML 5". World Wide Web Consortium. 17 July 2009. अभिगमन तिथि 2008-11-16.
  31. "HTML5". World Wide Web Consortium. 24 October 2008. अभिगमन तिथि 2008-11-16.
  32. Doctype के साथ ब्राउज़र मोड को सक्रिय करना
  33. "On SGML and HTML". World Wide Web Consortium. अभिगमन तिथि 2008-11-16.
  34. "XHTML 1.0 - Differences with HTML 4". World Wide Web Consortium. अभिगमन तिथि 2008-11-16.
  35. Korpela, Jukka (1998-07-06). "Why attribute values should always be quoted in HTML". Cs.tut.fi. अभिगमन तिथि 2008-11-16.
  36. "Objects, Images, and Applets in HTML documents". World Wide Web Consortium. 1999-12-24. अभिगमन तिथि 2008-11-16.
  37. "XHTML 1.0 The Extensible HyperText Markup Language (Second Edition)". World Wide Web Consortium. 2000, revised 2002. अभिगमन तिथि 7 December 2008. XHTML Documents which follow the guidelines set forth in Appendix C, "HTML Compatibility Guidelines" may be labeled with the Internet Media Type "text/html" [RFC2854], as they are compatible with most HTML browsers. Those documents, and any other document conforming to this specification, may also be labeled with the Internet Media Type "application/xhtml+xml" as defined in [RFC3236]. |date= में तिथि प्राचल का मान जाँचें (मदद)
  38. "RFC 2119: Key words for use in RFCs to Indicate Requirement Levels". Harvard University. 1997. अभिगमन तिथि 7 December 2008. 3. SHOULD This word, or the adjective "RECOMMENDED", mean that there may exist valid reasons in particular circumstances to ignore a particular item, but the full implications must be understood and carefully weighed before choosing a different course.
  39. "XHTML 1.1 - Module-based XHTML - Second Edition". World Wide Web Consortium. 2007. अभिगमन तिथि 7 December 2008. XHTML 1.1 documents SHOULD be labeled with the Internet Media Type text/html as defined in [RFC2854] or application/xhtml+xml as defined in [RFC3236].
  40. देखें, XHTML # HTML से सम्बन्ध
  41. Freeman, E(2005). Freeman, E (2005). Head First HTML. O'Reilly.
  42. Jakob Nielsen (2005-01-03). "Reviving Advanced Hypertext". अभिगमन तिथि 2007-06-16.

बाह्य लिंक

HTML Tutorials

साँचा:W3C Standards