अक्षर कोडन
अक्षर कूटन या संप्रतीक कूटन (character encoding) के अन्तर्गत किसी लेखन पद्धति में प्रयुक्त सभी अक्षरों एवं प्रतीकों के लिये अलग-अलग संख्याएँ निर्धारित कर दी जाती हैं। उदाहरण के लिये आस्की (ASCII) में लैटिन अक्षर A को निरूपित करने के लिये संख्या 65 निर्धारित की गयी है; B के लिये 66, C के लिये 67 आदि। इन्हीं संख्याओं को 'कूट' या 'संप्रतीक कूट' कहा जाता है। कम्प्युटर के अन्दर किसी टेक्स्ट को सहेजने या निरुपित करने के लिये इन्हीं संख्याओं का प्रयोग होता है।
मोर्स कोड, आस्की और नवीनतम यूनिकोड, 'अक्षर कूटन' के कुछ प्रकार हैं।
'अक्षर कूटन' के स्थान पर 'संप्रतीक सेट', 'संप्रतीक मैप' और 'कूट पृष्ट' आदि शब्दों का प्रयोग भी किया जाता है। कभी-कभी 'अक्षर कूटन' से सीमित अर्थ लगाया जाता है। यूनिकोड के आने के बाद पुराने अक्षर कोडिंग को 'लिगेसी कोडिंग' कहा जाने लगा है। देवनागरी के लिये कृतिदेव, सुशा, चाणक्य आदि पुराने कोडिंग प्रयोग होते थे।
इतिहास
[संपादित करें]- १८४० : मोर्स कोड
- १९३० : ५-बिट वाला बोडॉट कूट (Baudot code)
- १९६३ : ७-बिट आस्की (ASCII) का जन्म
- १९८१ : आस्की का ८-बिट में परिवर्धन
- १९९१ : यूनिकोड का प्रस्ताव रखा गया
प्रमुख अक्षर कूट
[संपादित करें]- ISO 646
- आस्की (ASCII)
- EBCDIC
- ISO 8859:
- ISO 8859-1 पश्चिमी यूरोप
- ISO 8859-2 पश्चिमी और केन्द्द्रीय यूरोप
- ISO 8859-3 पश्चिमी तथा दक्षिण यूरोप (तुर्की, Maltese plus Esperanto)
- ISO 8859-4 पश्चिमी यूरोप तथा बाल्टिक देश (लिथुआनिया, Estonia, Latvia and Lapp)
- ISO 8859-5 रूसी वर्णमाला (Cyrillic alphabet)
- ISO 8859-6 अरबी
- ISO 8859-7 यूनानी (Greek)
- ISO 8859-8 हिब्रू
- ISO 8859-9 Western Europe with amended Turkish character set
- ISO 8859-10 Western Europe with rationalised character set for Nordic languages, including complete Icelandic set
- ISO 8859-11 Thai
- ISO 8859-13 Baltic languages plus Polish
- ISO 8859-14 Celtic languages (Irish Gaelic, Scottish, Welsh)
- ISO 8859-15 Added the Euro sign and other rationalisations to ISO 8859-1
- ISO 8859-16 Central, Eastern and Southern European languages (Albanian, Croatian, Hungarian, Polish, Romanian, Serbian and Slovenian, but also French, German, Italian and Irish Gaelic)
- CP437, CP737, CP850, CP852, CP855, CP857, CP858, CP860, CP861, CP862, CP863, CP865, CP866, CP869
- MS-Windows character sets:
- Windows-1250 for Central European languages that use Latin script, (Polish, Czech, Slovak, Hungarian, Slovene, Serbian, Croatian, Romanian and Albanian)
- Windows-1251 for Cyrillic alphabets
- Windows-1252 for Western languages
- Windows-1253 for Greek
- Windows-1254 for Turkish
- Windows-1255 for Hebrew
- Windows-1256 for Arabic
- Windows-1257 for Baltic languages
- Windows-1258 for Vietnamese
- Mac OS Roman
- KOI8-R, KOI8-U, KOI7
- MIK
- इस्की (ISCII)
- TSCII
- VISCII
- JIS X 0208 is a widely deployed standard for Japanese character encoding that has several encoding forms.
- Shift JIS (Microsoft Code page 932 is a dialect of Shift_JIS)
- EUC-JP
- ISO-2022-JP
- JIS X 0213 is an extended version of JIS X 0208.
- Chinese Guobiao
- तैवान Big5 (a more famous variant is Microsoft Code page 950)
- हांग कांग HKSCS
- कोरियाई
- KS X 1001 is a Korean double-byte character encoding standard
- EUC-KR
- ISO-2022-KR
- यूनिकोड (तथा इसके उपसमुच्चय, जैसे 16-बिट 'Basic Multilingual Plane'). देखें यूटीएफ-8
- ANSEL or ISO/IEC 6937