ओसीआर
विकिपीडिया, एक मुक्त ज्ञानकोष से
ये लेख अपनी प्रारम्भिक अवस्था में है, यानि कि एक आधार है। आप इसे बढ़ाकर विकिपीडिया की मदद कर सकते है। ![]()
इस पृष्ठ के कुछ विभाग हिन्दी के अलावा अन्य भाषा(ओं) में भी लिखे गये हैं। आप इनका अनुवाद करके विकिपीडिया की सहायता कर सकते हैं। ![]()
हस्तलिखित, टाइप किये हुए या प्रिन्ट किये हुए पाठ (टेक्स्ट) की छबि का कम्प्यूटर द्वारा पढ़े जाने योग्य टेक्स्ट रूप में परिवर्तन ओसीआर (प्रकाश द्वारा वर्णों की पहचान/Optical charecter recognition) कहलाती है। आजकल यह छबि-प्रसंस्करण पर आधारित कम्प्यूटर प्रोग्रामों द्वारा आसानी से सम्भव हो गया है किन्तु इसे यांत्रिक तरीकों से भी करना सम्भव है।
वस्तुत: यह पैटर्न की पहचान, कृत्रिम बुद्धि और मशीनी-दृष्टि (machine vision) के क्षेत्र में अनुसंधान का एक क्षेत्र है। पहले ओसीआर प्रोग्रामों को प्रशिक्षित करना पड़ता था किन्तु अब बहुत से 'बुद्धिमान' प्रोग्राम भी बना दिये गये हैं जो अधिकांश फांटों को बहुत अधिक शुद्धता के साथ पहचान लेते हैं।
[संपादित करें] बाहरी कड़ियाँ
- संस्कृत ओसीआर - इस ओसीआर का इंटरफेस जर्मन में है। यह देवनागरी की ८०-९०% शुद्धता के साथ पहचान करता है। इसका आउटपुट रोमन में आताहै जिसको देवनागरी में बदलने का प्रोग्राम उपलब्ध है।
- चित्रांकन - भारतीय लिपियों के लिये पहला ओसीआर (सी डैक द्वारा विकसित)
- विन्डोज के लिये चिट्रांकन ओसीआर का डाउनलोड
- ICDAR'07, ICDAR'09, a comprehensive conference on all aspects of document recognition
- Linux OCR: A review of free optical character recognition software
- 17 Things Explanation of basic handwriting recognition principles and history
- Unicode OCR - Hex Range: 2440-245F Optical Character Recognition in Unicode