facebook
/

mbart-large-en-ro

Inference Endpoints

Model card Files Files and versions Community

patrickvonplaten commited on Jan 10, 2021

Commit

c48ad1f

•

1 Parent(s): 129775b

add tf model file

Files changed (2) hide show

config.json +9 -2
tf_model.h5 +3 -0

config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "_num_labels": 3,
   "activation_dropout": 0.0,
   "activation_function": "gelu",
@@ -7,18 +8,23 @@
   "attention_dropout": 0.1,
   "bos_token_id": 0,
   "classif_dropout": 0.1,
   "d_model": 1024,
   "decoder_attention_heads": 16,
   "decoder_ffn_dim": 4096,
   "decoder_layerdrop": 0.0,
   "decoder_layers": 12,
-  "dropout": 0.1,
   "encoder_attention_heads": 16,
   "encoder_ffn_dim": 4096,
   "encoder_layerdrop": 0.0,
   "encoder_layers": 12,
   "eos_token_id": 2,
   "extra_pos_embeddings": 2,
   "id2label": {
     "0": "LABEL_0",
     "1": "LABEL_1",
@@ -32,7 +38,6 @@
     "LABEL_2": 2
   },
   "max_length": 1024,
-  "decoder_start_token_id": 250020,
   "max_position_embeddings": 1024,
   "model_type": "mbart",
   "normalize_before": true,
@@ -43,5 +48,7 @@
   "pad_token_id": 1,
   "scale_embedding": true,
   "static_position_embeddings": false,
   "vocab_size": 250027
 }

 {
+  "_name_or_path": "facebook/mbart-large-en-ro",
   "_num_labels": 3,
   "activation_dropout": 0.0,
   "activation_function": "gelu",
   "attention_dropout": 0.1,
   "bos_token_id": 0,
   "classif_dropout": 0.1,
+  "classifier_dropout": 0.0,
   "d_model": 1024,
   "decoder_attention_heads": 16,
   "decoder_ffn_dim": 4096,
   "decoder_layerdrop": 0.0,
   "decoder_layers": 12,
+  "decoder_start_token_id": 250020,
+  "do_blenderbot_90_layernorm": false,
+  "dropout": 0.1,
   "encoder_attention_heads": 16,
   "encoder_ffn_dim": 4096,
   "encoder_layerdrop": 0.0,
   "encoder_layers": 12,
   "eos_token_id": 2,
   "extra_pos_embeddings": 2,
+  "force_bos_token_to_be_generated": false,
+  "gradient_checkpointing": false,
   "id2label": {
     "0": "LABEL_0",
     "1": "LABEL_1",
     "LABEL_2": 2
   },
   "max_length": 1024,
   "max_position_embeddings": 1024,
   "model_type": "mbart",
   "normalize_before": true,
   "pad_token_id": 1,
   "scale_embedding": true,
   "static_position_embeddings": false,
+  "transformers_version": "4.2.0dev0",
+  "use_cache": true,
   "vocab_size": 250027
 }

tf_model.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:51449b7a9d58d33245d5f69a87f7fd6b7c6becb5151dfff6bbd2b7d72d4b07eb
+size 2443942072