Upload folder using huggingface_hub

Files changed (9) hide show

gliner_config.json CHANGED Viewed

@@ -1,6 +1,7 @@
 {
   "class_token_index": -1,
-  "dropout": 0.3,
   "embed_ent_token": true,
   "encoder_config": {
     "_name_or_path": "microsoft/deberta-v3-base",
@@ -91,7 +92,8 @@
     "vocab_size": 128100
   },
   "ent_token": "<<ENT>>",
-  "eval_every": 5000,
   "fine_tune": true,
   "freeze_token_rep": false,
   "fuse_layers": false,
@@ -177,40 +179,40 @@
     "use_cache": true,
     "vocab_size": 30522
   },
-  "log_dir": "deberta/",
   "loss_alpha": 0.8,
   "loss_gamma": 2,
   "loss_reduction": "sum",
   "lr_encoder": "1e-5",
   "lr_others": "5e-5",
   "max_grad_norm": 10.0,
-  "max_len": 512,
-  "max_neg_type_ratio": 1,
-  "max_types": 100,
   "max_width": 12,
   "model_name": "microsoft/deberta-v3-base",
   "model_type": "gliner",
-  "name": "span level gliner",
   "num_post_fusion_layers": 1,
-  "num_steps": 100000,
   "post_fusion_schema": "",
   "prev_path": null,
   "random_drop": true,
   "root_dir": "gliner_logs",
-  "save_total_limit": 3,
   "scheduler_type": "cosine",
   "sep_token": "<<SEP>>",
   "shuffle_types": true,
   "size_sup": -1,
   "span_mode": "markerV0",
   "subtoken_pooling": "first",
-  "train_batch_size": 8,
-  "train_data": "data/nuner_train.json",
   "transformers_version": "4.45.2",
-  "val_data_dir": "none",
   "vocab_size": -1,
-  "warmup_ratio": 0.05,
-  "weight_decay_encoder": 0.1,
-  "weight_decay_other": 0.1,
   "words_splitter_type": "whitespace"
 }

 {
+  "blank_prompt_rep_layer": true,
   "class_token_index": -1,
+  "dropout": 0.36,
   "embed_ent_token": true,
   "encoder_config": {
     "_name_or_path": "microsoft/deberta-v3-base",
     "vocab_size": 128100
   },
   "ent_token": "<<ENT>>",
+  "entity_linking": null,
+  "eval_every": 2000,
   "fine_tune": true,
   "freeze_token_rep": false,
   "fuse_layers": false,
     "use_cache": true,
     "vocab_size": 30522
   },
+  "log_dir": "models-base/",
   "loss_alpha": 0.8,
   "loss_gamma": 2,
   "loss_reduction": "sum",
   "lr_encoder": "1e-5",
   "lr_others": "5e-5",
   "max_grad_norm": 10.0,
+  "max_len": 768,
+  "max_neg_type_ratio": 5,
+  "max_types": 256,
   "max_width": 12,
   "model_name": "microsoft/deberta-v3-base",
   "model_type": "gliner",
+  "name": "span level gliner for entity linking",
   "num_post_fusion_layers": 1,
+  "num_steps": 250000,
   "post_fusion_schema": "",
   "prev_path": null,
   "random_drop": true,
   "root_dir": "gliner_logs",
+  "save_total_limit": 20,
   "scheduler_type": "cosine",
   "sep_token": "<<SEP>>",
   "shuffle_types": true,
   "size_sup": -1,
   "span_mode": "markerV0",
   "subtoken_pooling": "first",
+  "train_batch_size": 4,
+  "train_data": "final_dataset_1m.json",
   "transformers_version": "4.45.2",
+  "val_data_dir": null,
   "vocab_size": -1,
+  "warmup_ratio": 0.1,
+  "weight_decay_encoder": 0.01,
+  "weight_decay_other": 0.02,
   "words_splitter_type": "whitespace"
 }

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:79cff4459315276b3b324f7f19e9dc4fc6695120a378f73ecce163d016f14f3a
 size 1909053417

 version https://git-lfs.github.com/spec/v1
+oid sha256:9d715bc24d43bc12d4495df9052db1a26c603409be463330444d10aab5e06a6f
 size 1909053417

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:162912f24f6b81e76cd6638c2faed1231a2cf3d6b4b691695b0acb23c2eb4280
 size 969281034

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0bb20d34cbf8143ca9dc32ed449c360a6dc34cfb2a19383360acd194344450e
 size 969281034

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90d9254ae162fde3dd03eb987833dd71a0322832c5dbe15b3531ab1506f92fe1
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:2245ff461e27bd85ebe7cf50effd201369973673cfc345f1fa7e0b8fa1aa7602
 size 14244

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:72f57446a912b7109bfcca09a664005360c14e07ba60ed50eb0f1c8e51bd8dba
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:15170f8dedcb512efd0826216d18529f578fcb9cf778e78614bfe3c54ac40dde
 size 1064

special_tokens_map.json CHANGED Viewed

@@ -1,46 +1,10 @@
 {
-  "bos_token": {
-    "content": "[CLS]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "cls_token": {
-    "content": "[CLS]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "eos_token": {
-    "content": "[SEP]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "mask_token": {
-    "content": "[MASK]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": {
-    "content": "[PAD]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "sep_token": {
-    "content": "[SEP]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
   "unk_token": {
     "content": "[UNK]",
     "lstrip": false,

 {
+  "bos_token": "[CLS]",
+  "cls_token": "[CLS]",
+  "eos_token": "[SEP]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
   "unk_token": {
     "content": "[UNK]",
     "lstrip": false,

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -42,7 +42,7 @@
     }
   },
   "bos_token": "[CLS]",
-  "clean_up_tokenization_spaces": true,
   "cls_token": "[CLS]",
   "do_lower_case": false,
   "eos_token": "[SEP]",

     }
   },
   "bos_token": "[CLS]",
+  "clean_up_tokenization_spaces": false,
   "cls_token": "[CLS]",
   "do_lower_case": false,
   "eos_token": "[SEP]",

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff