anzorq
/

m2m100_418M_ft_ru-kbd_50K

Text2Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

anzorq commited on Sep 26, 2023

Commit

cfc9b2b

•

1 Parent(s): c6dd249

Model save

Files changed (3) hide show

README.md +2 -7
generation_config.json +1 -1
pytorch_model.bin +1 -1

README.md CHANGED Viewed

@@ -1,13 +1,8 @@
 ---
-language:
-- ru
-- zu
 license: mit
 base_model: facebook/m2m100_418M
 tags:
 - generated_from_trainer
-datasets:
-- anzorq/ru-kbd
 model-index:
 - name: m2m100_418M_ft_ru-kbd_50K
   results: []
@@ -18,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 # m2m100_418M_ft_ru-kbd_50K
-This model is a fine-tuned version of [facebook/m2m100_418M](https://huggingface.co/facebook/m2m100_418M) on the anzorq/ru-kbd dataset.
 ## Model description
@@ -43,7 +38,7 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 3.0
 ### Training results

 ---
 license: mit
 base_model: facebook/m2m100_418M
 tags:
 - generated_from_trainer
 model-index:
 - name: m2m100_418M_ft_ru-kbd_50K
   results: []
 # m2m100_418M_ft_ru-kbd_50K
+This model is a fine-tuned version of [facebook/m2m100_418M](https://huggingface.co/facebook/m2m100_418M) on an unknown dataset.
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 6.0
 ### Training results

generation_config.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "bos_token_id": 0,
   "decoder_start_token_id": 2,
   "early_stopping": true,
   "eos_token_id": 2,
-  "forced_bos_token_id": 128103,
   "max_length": 200,
   "num_beams": 5,
   "pad_token_id": 1,

 {
+  "_from_model_config": true,
   "bos_token_id": 0,
   "decoder_start_token_id": 2,
   "early_stopping": true,
   "eos_token_id": 2,
   "max_length": 200,
   "num_beams": 5,
   "pad_token_id": 1,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8be276abd6cd53cf1ddd652e5f64d2277ae83b3e2b502faf27e65ce642420218
 size 1935795713

 version https://git-lfs.github.com/spec/v1
+oid sha256:d92be3b351ff02b799c2e1636bd0ee4ea98d7cc4ebb3c7a370377330049ba8d6
 size 1935795713