इण्डोवर्डनेट

मुक्त ज्ञानकोश विकिपीडिया से

इंडॉवर्डनेट [1] भारत की 18 अनुसूचित भाषाओं का एक जुड़ा हुआ शाब्दिक ज्ञान का आधार है। इसमें असमिया, बांग्ला, बोडो, गुजराती, हिंदी, कन्नड़, कश्मीरी, कोंकणी, मलयालम, मैतेई (मणिपुरी), मराठी, नेपाली, उड़िया, पंजाबी, संस्कृत, तमिल, तेलुगु और उर्दू के शब्दनेट हैं।


इस पर कार्य २००० ई में आरम्भ हुआ। सबसे पहले हिन्दी का वर्डनेट बना जिसे आईआईटी मुम्बई ने बनाया। यह २००६ ई में पूरा हुआ। बाद में अन्य भाषाओं के शब्दनेट बने और इन्हें एकसाथ जोड़ा गया।

इण्डोवर्डनेट के आंकड़े[संपादित करें]

वर्डनेट बनाने वाली भाषाओं और संस्थानों में सिनसेट की संख्या (अगस्त 2014 तक) नीचे दी गई है:

भाषा सिनसेट संस्था
असमिया 14958 गुवाहाटी विश्वविद्यालय, गुवाहाटी, असम
बंगाली 36346 भारतीय सांख्यिकी संस्थान, कोलकाता, पश्चिम बंगाल
बोडो 15785 गुवाहाटी विश्वविद्यालय, गुवाहाटी, असम
गुजराती 35599 धर्मसिंह देसाई विश्वविद्यालय, नडियाद, गुजरात
हिन्दी 38607 आईआईटी बॉम्बे, मुंबई, महाराष्ट्र
कन्नड़ 20033 मैसूर विश्वविद्यालय, मैसूर, कर्नाटक
कश्मीरी 29469 कश्मीर विश्वविद्यालय, श्रीनगर, जम्मू और कश्मीर
कोंकणी 32370 गोवा विश्वविद्यालय, तालेगाओ, गोवा
मलयालम 30060 अमृता विश्वविद्यालय, कोयंबटूर, तमिलनाडु
मराठी 29674 आईआईटी बॉम्बे, मुंबई, महाराष्ट्र
मेइती 16351 मणिपुर विश्वविद्यालय, इंफाल, मणिपुर
नेपाली 11713 असम विश्वविद्यालय, सिलचर, असम
ओरिया 35284 हैदराबाद केंद्रीय विश्वविद्यालय, हैदराबाद, आंध्र प्रदेश
पंजाबी 32364 थापर विश्वविद्यालय और पंजाबी विश्वविद्यालय, पटियाला, पंजाब
संस्कृत 23140 आईआईटी बॉम्बे, मुंबई, महाराष्ट्र
तामिल 25431 तमिल विश्वविद्यालय, तंजावुर, तमिलनाडु
तेलुगू 21925 द्रविड़ विश्वविद्यालय, कुप्पम, आंध्र प्रदेश
उर्दू 34280 जवाहरलाल नेहरू विश्वविद्यालय, नई दिल्ली

संदर्भ[संपादित करें]

  1. Pushpak Bhattacharyya, IndoWordNet, Lexical Resources Engineering Conference 2010 (LREC 2010), Malta, May, 2010.

बाहरी कड़ियाँ[संपादित करें]