Training in progress, epoch 0

Files changed (5) hide show

adapter_config.json CHANGED Viewed

@@ -19,12 +19,12 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "k_proj",
     "up_proj",
-    "gate_proj",
     "q_proj",
     "o_proj",
     "v_proj",
     "down_proj"
   ],
   "task_type": "CAUSAL_LM",

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "up_proj",
+    "k_proj",
     "q_proj",
     "o_proj",
     "v_proj",
+    "gate_proj",
     "down_proj"
   ],
   "task_type": "CAUSAL_LM",

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9492fc4bc31843c29a4fe872483bf78357710419af68475b78644551e1a5cc1f
 size 3443619040

 version https://git-lfs.github.com/spec/v1
+oid sha256:a1a3b2bdaba5379297a84ec7a0bc298c8f07c3c25d877c1b12cae48775670a5b
 size 3443619040

runs/Jun01_08-22-29_e8ec2b83eda2/events.out.tfevents.1717230156.e8ec2b83eda2.4223.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f3ff9fbcc1260aaad8ded83a206f870ddadcd0e3d2dad0d89ffdd103a90966ca
+size 6411

tokenizer.json CHANGED Viewed

@@ -2347,10 +2347,69 @@
     ]
   },
   "post_processor": {
-    "type": "ByteLevel",
-    "add_prefix_space": true,
-    "trim_offsets": false,
-    "use_regex": true
   },
   "decoder": {
     "type": "ByteLevel",

     ]
   },
   "post_processor": {
+    "type": "Sequence",
+    "processors": [
+      {
+        "type": "ByteLevel",
+        "add_prefix_space": true,
+        "trim_offsets": false,
+        "use_regex": true
+      },
+      {
+        "type": "TemplateProcessing",
+        "single": [
+          {
+            "SpecialToken": {
+              "id": "<|begin_of_text|>",
+              "type_id": 0
+            }
+          },
+          {
+            "Sequence": {
+              "id": "A",
+              "type_id": 0
+            }
+          }
+        ],
+        "pair": [
+          {
+            "SpecialToken": {
+              "id": "<|begin_of_text|>",
+              "type_id": 0
+            }
+          },
+          {
+            "Sequence": {
+              "id": "A",
+              "type_id": 0
+            }
+          },
+          {
+            "SpecialToken": {
+              "id": "<|begin_of_text|>",
+              "type_id": 1
+            }
+          },
+          {
+            "Sequence": {
+              "id": "B",
+              "type_id": 1
+            }
+          }
+        ],
+        "special_tokens": {
+          "<|begin_of_text|>": {
+            "id": "<|begin_of_text|>",
+            "ids": [
+              128000
+            ],
+            "tokens": [
+              "<|begin_of_text|>"
+            ]
+          }
+        }
+      }
+    ]
   },
   "decoder": {
     "type": "ByteLevel",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5b7cf36829dd26d504423ee8ea0fb007ed93636b301e49356d7f07c61ace88a0
-size 4347

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c940ec85e55cb34809c3b7c7232c9a89a1e3e8e4d35706929438ceaee6ae8b7
+size 4792