ओसीआर

मुक्त ज्ञानकोश विकिपीडिया से
यहाँ जाएँ: भ्रमण, खोज
छपी हुई सामग्री को टेक्स्ट में बदलने की पूरी प्रक्रिया का ब्लॉक-आरेख

हस्तलिखित, टाइप किये हुए या प्रिन्ट किये हुए पाठ (टेक्स्ट) की छबि का कम्प्यूटर द्वारा पढ़े जाने योग्य टेक्स्ट रूप में परिवर्तन ओसीआर (प्रकाश द्वारा वर्णों की पहचान/Optical charecter recognition) कहलाती है। आजकल यह छबि-प्रसंस्करण पर आधारित कम्प्यूटर प्रोग्रामों द्वारा आसानी से सम्भव हो गया है किन्तु इसे यांत्रिक तरीकों से भी करना सम्भव है।

वस्तुत: यह पैटर्न की पहचान, कृत्रिम बुद्धि और मशीनी-दृष्टि (machine vision) के क्षेत्र में अनुसंधान का एक क्षेत्र है। पहले ओसीआर प्रोग्रामों को प्रशिक्षित करना पड़ता था किन्तु अब बहुत से 'बुद्धिमान' प्रोग्राम भी बना दिये गये हैं जो अधिकांश फांटों को बहुत अधिक शुद्धता के साथ पहचान लेते हैं।

उपयोग[संपादित करें]

ओसीआर का मुख्य उपयोग प्रिन्ट की गयी पुस्तकों के पृष्टों के स्कैन छबियों को लेकर उससे 'टेक्स्ट' में बदलना है। टेक्स्ट में बदलने से कई लाभ हैं-

  • टेक्स्ट का आकार (साइज) इमेज से बहुत कम होता है।
  • टेक्स्ट में खोजना (सर्च करना) एवं अन्य प्रसंस्करण बहुत आसान हैं, जैसे उसका अनुवाद करना, उस टेक्स्ट की लिपि बदलना, उस टेक्स्ट को ध्वनि में बदलना, तथा उस टेक्स्ट से अन्य सूचनाएँ निकाल पाना आदि।

प्रमुख ओसीआर प्रोग्राम[संपादित करें]

निःशुल्क ओसीआर[संपादित करें]

GOCR, SimpleOCR, TopOCR, FreeOCR आदि।

देवनागरी ओसीआर[संपादित करें]

इन्हें भी देखें[संपादित करें]

बाहरी कड़ियाँ[संपादित करें]