इण्डोवर्डनेट
दिखावट
इंडॉवर्डनेट [1] भारत की 18 अनुसूचित भाषाओं का एक जुड़ा हुआ शाब्दिक ज्ञान का आधार है। इसमें असमिया, बांग्ला, बोडो, गुजराती, हिंदी, कन्नड़, कश्मीरी, कोंकणी, मलयालम, मैतेई (मणिपुरी), मराठी, नेपाली, उड़िया, पंजाबी, संस्कृत, तमिल, तेलुगु और उर्दू के शब्दनेट हैं।
इस पर कार्य २००० ई में आरम्भ हुआ। सबसे पहले हिन्दी का वर्डनेट बना जिसे आईआईटी मुम्बई ने बनाया। यह २००६ ई में पूरा हुआ। बाद में अन्य भाषाओं के शब्दनेट बने और इन्हें एकसाथ जोड़ा गया।
इण्डोवर्डनेट के आंकड़े
[संपादित करें]वर्डनेट बनाने वाली भाषाओं और संस्थानों में सिनसेट की संख्या (अगस्त 2014 तक) नीचे दी गई है:
भाषा | सिनसेट | संस्था |
---|---|---|
असमिया | 14958 | गुवाहाटी विश्वविद्यालय, गुवाहाटी, असम |
बंगाली | 36346 | भारतीय सांख्यिकी संस्थान, कोलकाता, पश्चिम बंगाल |
बोडो | 15785 | गुवाहाटी विश्वविद्यालय, गुवाहाटी, असम |
गुजराती | 35599 | धर्मसिंह देसाई विश्वविद्यालय, नडियाद, गुजरात |
हिन्दी | 38607 | आईआईटी बॉम्बे, मुंबई, महाराष्ट्र |
कन्नड़ | 20033 | मैसूर विश्वविद्यालय, मैसूर, कर्नाटक |
कश्मीरी | 29469 | कश्मीर विश्वविद्यालय, श्रीनगर, जम्मू और कश्मीर |
कोंकणी | 32370 | गोवा विश्वविद्यालय, तालेगाओ, गोवा |
मलयालम | 30060 | अमृता विश्वविद्यालय, कोयंबटूर, तमिलनाडु |
मराठी | 29674 | आईआईटी बॉम्बे, मुंबई, महाराष्ट्र |
मेइती | 16351 | मणिपुर विश्वविद्यालय, इंफाल, मणिपुर |
नेपाली | 11713 | असम विश्वविद्यालय, सिलचर, असम |
ओरिया | 35284 | हैदराबाद केंद्रीय विश्वविद्यालय, हैदराबाद, आंध्र प्रदेश |
पंजाबी | 32364 | थापर विश्वविद्यालय और पंजाबी विश्वविद्यालय, पटियाला, पंजाब |
संस्कृत | 23140 | आईआईटी बॉम्बे, मुंबई, महाराष्ट्र |
तामिल | 25431 | तमिल विश्वविद्यालय, तंजावुर, तमिलनाडु |
तेलुगू | 21925 | द्रविड़ विश्वविद्यालय, कुप्पम, आंध्र प्रदेश |
उर्दू | 34280 | जवाहरलाल नेहरू विश्वविद्यालय, नई दिल्ली |
संदर्भ
[संपादित करें]- ↑ Pushpak Bhattacharyya, IndoWordNet, Lexical Resources Engineering Conference 2010 (LREC 2010), Malta, May, 2010.