Create README.md
#1
by
aishwaryamirashi
- opened
README.md
ADDED
@@ -0,0 +1,42 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
license: cc-by-4.0
|
3 |
+
language:
|
4 |
+
- or
|
5 |
+
tags:
|
6 |
+
- bert
|
7 |
+
datasets:
|
8 |
+
- L3Cube-IndicNews
|
9 |
+
widget:
|
10 |
+
- text: "ଭୁବନେଶ୍ୱର(ଓଡ଼ିଶା ଭାସ୍କର): ରାଜ୍ୟରେ ପଞ୍ଚାୟତ ଭୋଟ ସରିବା ପରେ ବର୍ତ୍ତମାନ ବାଜିସାରିଛି ପୌର ନିର୍ବାଚନର ବିଗୁଲ୍ । ସମସ୍ତଙ୍କର ନଜର ରହିଛି ଭୁବନେଶ୍ୱର ମହାନଗର ନିଗମ (ବିଏମସି) ମେୟର ପଦ ଉପରେ । ଇତିମଧ୍ୟରେ କଂଗ୍ରେସ ମଧୁସ୍ମିତା ଆଚାର୍ଯ୍ୟଙ୍କୁ ବିଏମସି ମେୟର ପ୍ରାର୍ଥୀ ଭାବେ ଘୋଷଣା କରିସାରିଥିବା ବେଳେ ନିଷ୍ପତ୍ତି ନେଇପାରୁ ନାହାନ୍ତି ବିଜେଡି ଓ ବିଜେପି । ତେବେ ରାଜ୍ୟର ମେରୁଦଣ୍ଡ କୁହାଯାଉଥିବା ରାଜଧାନୀ ଭୁବନେଶ୍ୱରରେ ମେୟର ସିଟ୍ ହାତେଇବା ଉଭୟ ବିଜେଡି ଓ ବିଜେପି ପାଇଁ ସମ୍ମାନର ପ୍ରଶ୍ନ ।ତେବେ ବିଜେଡିର ଡଜନ ଡଜନ ଆଶାୟୀଙ୍କୁ ନେଇ ଚର୍ଚ୍ଚା ହେଉଥିବା ବେଳେ ବିଜେପିର ହାତଗଣତିଙ୍କ ନାମ ସାମ୍ନାକୁ ଆସିଛି । ତେବେ ଆଜିକାଲି ଭିତରେ ଦୁଇଦଳ ମେୟର ପ୍ରାର୍ଥୀଙ୍କ ନାମ ଘୋଷଣା କରିପାରନ୍ତି ବୋଲି କୁହାଯାଉଛି । ତେବେ ଭୁବନେଶ୍ୱରର ସାଂସଦ ଅପରାଜିତା ଷଡ଼ଙ୍ଗୀଙ୍କ ପାଇଁ ଏହି ନିର୍ବାଚନ ସମ୍ମାନର ପ୍ରଶ୍ନ ହେବ । ସେ ଦଳ ପାଇଁ ରଣନୀତି ପ୍ରସ୍ତୁତ କରୁଥିବା ଜଣାପଡ଼ିଛି । ଗତ ୨୦୧୯ ନିର୍ବାଚନ ସମୟରେ ବିଜେଡି ଏଠାରୁ ୩ଟି ବିଧାୟକ ସିଟ୍ ହାତେଇଥିବା ବେଳେ ସାଂସଦ ଲଢ଼େଇରେ ଅପରାଜିତାଙ୍କ ସମ୍ମୁଖରେ ଆଣ୍ଠେଇ ପଡ଼ିଥିଲା ।ସେଥିପାଇଁ ଚଳିତ ଥର ବିଜେଡିକୁ ଚକମା ଦେବା ଲକ୍ଷ୍ୟରେ ରହିଛନ୍ତି ଅପରାଜିତା । ଅନ୍ୟପକ୍ଷରେ ୨୦୦୮ରେ ପ୍ରଥମ ଥର ପାଇଁ ଭୁବନେଶ୍ୱର ମେୟର ହୋଇଥିବା ଅନନ୍ତ ନାରାୟଣ ଜେନା ଏବେ ବିଧାୟକ ଅଛନ୍ତି । ମେୟର ଭାବେ ତାଙ୍କର ଯଥେଷ୍ଟ ଅଭିଜ୍ଞତା ଥିବାରୁ ସେ ପ୍ରାର୍ଥୀ ମନୋନୟନଠାରୁ ଆରମ୍ଭ କରି ରଣନୀତି ପ୍ରସ୍ତୁତ କରୁଛନ୍ତି । ଏକଦା ଅପରାଜିତା ଓ ଅନନ୍ତ ଏକତ୍ର ଭାବେ କାର୍ଯ୍ୟ କରି ଭୁବନେଶ୍ୱରର ବିକାଶ କରି ବହୁ ପ୍ରଶଂସା ପାଇଥିଲେ । ଗତ ବିଧାନସଭା ନିର୍ବାଚନ ସମୟରେ ଦୁହେଁ ମୁହାଁମୁହିଁ ହୋଇଥିବା ବେଳେ ପୁଣି ଥରେ ହେବେ ସାମ୍ନାସାମ୍ନି । ଆଗକୁ ଜଣାପଡ଼ିବ, ନିର୍ବାଚନ ପଶାପାଲିରେ କାହାର ଗୋଟିର ଦମ୍ କେତେ ।"
|
11 |
+
|
12 |
+
- text: "ମୁମ୍ବାଇ: ପ୍ରତ୍ୟେକ ଥର ଉର୍ଫି ଜାଭେଦ ତାଙ୍କ ଡ୍ରେସ୍କୁ ନେଇ ଚର୍ଚ୍ଚାକୁ ଆସିଥାନ୍ତି। ଏଥର ମଧ୍ୟ ଉର୍ଫି ତାଙ୍କ ଲୁକ୍ ପାଇଁ ସୋସିଆଲ ମିଡିଆରେ ଟ୍ରୋଲ୍ର ଶିକାର ହୋଇଛନ୍ତି। ଉର୍ଫି ଏକ ପତଳା ସୂତା ଡୋରରେ ଫୁଲ ଲାଗିଥିବା ବ୍ଲାଉଜ ପିନ୍ଧିଛନ୍ତି। ତାଙ୍କର ଏପରି ଲୁକ୍ ଦେଖି ଲୋକମାନେ ଖୁବ୍ ମଜା ଉଡ଼ାଉଛନ୍ତି। ଜଣେ ୟୁଜର ଲେଖିଛନ୍ତି, ‘ମୁସ୍ଲିମ୍ ନାମରେ କଳଙ୍କ।’ ଆଉ ଜଣେ ଲେଖିଛନ୍ତି, ‘ତୁମେ ଏମିତି କାହିଁକି କରୁଛ?’ଅନ୍ୟ ଜଣେ ୟୁଜର ଲେଖିଛନ୍ତି, ‘ତୁମକୁ ଲାଜ ନାହିଁ? ସେହିପରି ଆଉ ଜଣେ କହିଛନ୍ତି, ପ୍ରସିଦ୍ଧ ହେବା ପାଇଁ କିଛି ବି କରିବାକୁ ପ୍ରସ୍ତୁତ। ଉର୍ଫିଙ୍କ ଏହି ଭିଡିଓରେ ଆହୁରି ଅନେକ ମନ୍ତବ୍ୟ ଦେଖିବାକୁ ମିଳିଛି।"
|
13 |
+
|
14 |
+
---
|
15 |
+
|
16 |
+
## Odia-Doc-Topic-BERT
|
17 |
+
Odia-Doc-Topic-BERT model is an IndicSBERT(<a href="https://huggingface.co/l3cube-pune/odia-sentence-bert-nli">l3cube-pune/odia-sentence-bert-nli</a>) model fine-tuned on Odia documents from the L3Cube-IndicNews Corpus [dataset link]https://github.com/l3cube-pune/indic-nlp. <br>
|
18 |
+
This dataset consists of sub-datasets like LDC (Long Document Classification), LPC (Long Paragraph Classification), and SHC (Short Headlines Classification), each having different document lengths. <br>
|
19 |
+
This model is trained on a combination of all three variants and works well across different document sizes.
|
20 |
+
|
21 |
+
More details on the dataset, models, and baseline results can be found in our [paper]https://arxiv.org/abs/2401.02254
|
22 |
+
|
23 |
+
Citing:
|
24 |
+
```
|
25 |
+
@article{mirashi2024l3cube,
|
26 |
+
title={L3Cube-IndicNews: News-based Short Text and Long Document Classification Datasets in Indic Languages},
|
27 |
+
author={Mirashi, Aishwarya and Sonavane, Srushti and Lingayat, Purva and Padhiyar, Tejas and Joshi, Raviraj},
|
28 |
+
journal={arXiv preprint arXiv:2401.02254},
|
29 |
+
year={2024}
|
30 |
+
}
|
31 |
+
```
|
32 |
+
|
33 |
+
Other document topic models for different Indic languages are listed below: <br>
|
34 |
+
<a href='https://huggingface.co/l3cube-pune/hindi-topic-all-doc'> Hindi-Doc-Topic-BERT </a> <br>
|
35 |
+
<a href='https://huggingface.co/l3cube-pune/bengali-topic-all-doc'> Bengali-Doc-Topic-BERT </a> <br>
|
36 |
+
<a href='https://huggingface.co/l3cube-pune/marathi-topic-all-doc-v2'> Marathi-Doc-Topic-BERT </a> <br>
|
37 |
+
<a href='https://huggingface.co/l3cube-pune/telugu-topic-all-doc'> Telugu-Doc-Topic-BERT </a> <br>
|
38 |
+
<a href='https://huggingface.co/l3cube-pune/tamil-topic-all-doc'> Tamil-Doc-Topic-BERT </a> <br>
|
39 |
+
<a href='https://huggingface.co/l3cube-pune/gujarati-topic-all-doc'> Gujarati-Doc-Topic-BERT </a> <br>
|
40 |
+
<a href='https://huggingface.co/l3cube-pune/kannada-topic-all-doc'> Kannada-Doc-Topic-BERT </a> <br>
|
41 |
+
<a href='https://huggingface.co/l3cube-pune/malayalam-topic-all-doc'> Malayalam-Doc-Topic-BERT </a> <br>
|
42 |
+
<a href='https://huggingface.co/l3cube-pune/punjabi-topic-all-doc'> Punjabi-Doc-Topic-BERT </a> <br>
|