Trained with Unsloth

Files changed (7) hide show

README.md CHANGED Viewed

@@ -1,4 +1,5 @@
 ---
 language:
 - en
 - tr
@@ -10,7 +11,6 @@ tags:
 - llama
 - trl
 - sft
-base_model: unsloth/llama-3-8b-bnb-4bit
 ---
 # Uploaded  model

 ---
+base_model: unsloth/llama-3-8b-bnb-4bit
 language:
 - en
 - tr
 - llama
 - trl
 - sft
 ---
 # Uploaded  model

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "unsloth/llama-3-8b-bnb-4bit",
   "architectures": [
     "LlamaForCausalLM"
   ],
@@ -11,19 +11,27 @@
   "hidden_size": 4096,
   "initializer_range": 0.02,
   "intermediate_size": 14336,
-  "max_position_embeddings": 8192,
   "model_type": "llama",
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
-  "rope_scaling": null,
   "rope_theta": 500000.0,
   "tie_word_embeddings": false,
-  "torch_dtype": "float16",
-  "transformers_version": "4.40.1",
-  "unsloth_version": "2024.4",
   "use_cache": true,
   "vocab_size": 128256
 }

 {
+  "_name_or_path": "unsloth/meta-llama-3.1-8b-bnb-4bit",
   "architectures": [
     "LlamaForCausalLM"
   ],
   "hidden_size": 4096,
   "initializer_range": 0.02,
   "intermediate_size": 14336,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
   "model_type": "llama",
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
+  "pad_token_id": 128004,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
   "rope_theta": 500000.0,
   "tie_word_embeddings": false,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.43.1",
+  "unsloth_version": "2024.7",
   "use_cache": true,
   "vocab_size": 128256
 }

generation_config.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "_from_model_config": true,
   "bos_token_id": 128000,
-  "eos_token_id": [
-    128001,
-    128009
-  ],
-  "transformers_version": "4.40.1"
 }

 {
   "_from_model_config": true,
   "bos_token_id": 128000,
+  "do_sample": true,
+  "eos_token_id": 128001,
+  "temperature": 0.6,
+  "top_p": 0.9,
+  "transformers_version": "4.43.1"
 }

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1b5f8700a1090276b6244727cae5b45231dc1b9d39d4fd9effb032c6b9b7b613
-size 4976698592

 version https://git-lfs.github.com/spec/v1
+oid sha256:140e6fc450bb28a9051df4d1ee9850408c6ed9fd393dc90b8d86c8e45dbb7462
+size 4976698672

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6aff642878d8f88b806df8e6bc4d96dba7631189febb730682a7223e9e8e59ab
-size 4999802616

 version https://git-lfs.github.com/spec/v1
+oid sha256:743cbc9fd5a16fc915e339dc10304f3dce0cbd40f6b2651aff3d175fd0745f62
+size 4999802720

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2e127e01a092c7dbcbfd08f7749e44b996ed458cb6019a9572f67024f74d324f
-size 4915916080

 version https://git-lfs.github.com/spec/v1
+oid sha256:a0438b017092bd46ce86c446622e001ccf01cecc3c42a2011735151fdf179998
+size 4915916176

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:893da9f0cd1adb82985b129ff0a0b3be3c361ec35baafdd8dfcae723284f44b7
 size 1168138808

 version https://git-lfs.github.com/spec/v1
+oid sha256:ad8f3ed9299b3084365c043b28d115618c7283222bda309fb6b02beb31581348
 size 1168138808