IDEA-CCNL
/

Randeng-T5-784M-QA-Chinese

Question Answering

text2text-generation

text-generation

Inference Endpoints

Model card Files Files and versions Community

Justcode commited on Nov 3, 2022

Commit

5e07387

•

1 Parent(s): 18724b6

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -25,7 +25,7 @@ licence: apache-2.0
 ---
 # Randeng-T5-784M-QA-Chinese
 T5 for Chinese Question Answering
-- Github: [Fengshenbang-LM](https://github.com/IDEA-CCNL/Fengshenbang-LM)
 - Docs: [Fengshenbang-Docs](https://fengshenbang-doc.readthedocs.io/)
@@ -80,7 +80,7 @@ plain_text='question:'+sample['question']+'knowledge:'+sample['context'][:self.m
 res_prefix=tokenizer.encode('answer',add_special_token=False)
 res_prefix.append(tokenizer.convert_tokens_to_ids('<extra_id_0>')
-res_prefix.appedn(EOS_TOKEN_ID)
 l_rp=len(res_prefix)
 tokenized=tokenizer.encode(plain_text,add_special_tokens=False,truncation=True,max_length=self.max_seq_length-2-l_rp)
@@ -90,7 +90,7 @@ tokenized+=res_prefix
 # Generate answer
 pred_ids = model.generate(input_ids=tokenized,max_new_token=self.max_target_length,do_sample=True,top_p=0.9)
 pred_tokens=tokenizer.batch_decode(pred_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
-res=pred_tokens.replace('<extra_id_0>','').replace('有答案:')
 ```

 ---
 # Randeng-T5-784M-QA-Chinese
 T5 for Chinese Question Answering
+- Github: [Fengshenbang-LM](https://github.com/IDEA-CCNL/Fengshenbang-LM/tree/main/fengshen/examples/qa_t5)
 - Docs: [Fengshenbang-Docs](https://fengshenbang-doc.readthedocs.io/)
 res_prefix=tokenizer.encode('answer',add_special_token=False)
 res_prefix.append(tokenizer.convert_tokens_to_ids('<extra_id_0>')
+res_prefix.append(EOS_TOKEN_ID)
 l_rp=len(res_prefix)
 tokenized=tokenizer.encode(plain_text,add_special_tokens=False,truncation=True,max_length=self.max_seq_length-2-l_rp)
 # Generate answer
 pred_ids = model.generate(input_ids=tokenized,max_new_token=self.max_target_length,do_sample=True,top_p=0.9)
 pred_tokens=tokenizer.batch_decode(pred_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
+res=pred_tokens.replace('<extra_id_0>','').replace('有答案:','')
 ```