Upload folder using huggingface_hub

Browse files

Files changed (9) hide show

.gitattributes +1 -0
config.json +147 -17
generation_config.json +1 -1
model-00001-of-00003.safetensors +3 -0
model-00002-of-00003.safetensors +3 -0
model-00003-of-00003.safetensors +3 -0
model.safetensors.index.json +0 -0
recipe.yaml +6 -0
tokenizer.json +0 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

config.json CHANGED Viewed

@@ -1,11 +1,23 @@
 {
-  "_name_or_path": "/home/mgoin/.cache/huggingface/hub/models--Qwen--Qwen2-VL-7B-Instruct/snapshots/3ca981c995b0ce691d85d8408216da11ff92f690",
   "architectures": [
     "Qwen2VLForConditionalGeneration"
   ],
   "attention_dropout": 0.0,
   "bos_token_id": 151643,
-  "compression_config": {
     "config_groups": {
       "group_0": {
         "input_activations": {
@@ -14,7 +26,7 @@
           "dynamic": true,
           "group_size": null,
           "num_bits": 8,
-          "observer": "memoryless",
           "observer_kwargs": {},
           "strategy": "token",
           "symmetric": true,
@@ -39,26 +51,144 @@
       }
     },
     "format": "float-quantized",
-    "global_compression_ratio": 1.2311753355829242,
     "ignore": [
       "lm_head"
     ],
     "kv_cache_scheme": null,
     "quant_method": "compressed-tensors",
     "quantization_status": "compressed"
   },
-  "eos_token_id": 151645,
-  "hidden_act": "silu",
-  "hidden_size": 3584,
-  "image_token_id": 151655,
-  "initializer_range": 0.02,
-  "intermediate_size": 18944,
-  "max_position_embeddings": 32768,
-  "max_window_layers": 28,
-  "model_type": "qwen2_vl",
-  "num_attention_heads": 28,
-  "num_hidden_layers": 28,
-  "num_key_value_heads": 4,
   "rms_norm_eps": 1e-06,
   "rope_scaling": {
     "mrope_section": [
@@ -73,7 +203,7 @@
   "sliding_window": 32768,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
-  "transformers_version": "4.45.0.dev0",
   "use_cache": true,
   "use_sliding_window": false,
   "video_token_id": 151656,

 {
+  "_name_or_path": "/home/mgoin/.cache/huggingface/hub/models--Qwen--Qwen2-VL-7B-Instruct/snapshots/51c47430f97dd7c74aa1fa6825e68a813478097f",
   "architectures": [
     "Qwen2VLForConditionalGeneration"
   ],
   "attention_dropout": 0.0,
   "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "hidden_act": "silu",
+  "hidden_size": 3584,
+  "image_token_id": 151655,
+  "initializer_range": 0.02,
+  "intermediate_size": 18944,
+  "max_position_embeddings": 32768,
+  "max_window_layers": 28,
+  "model_type": "qwen2_vl",
+  "num_attention_heads": 28,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 4,
+  "quantization_config": {
     "config_groups": {
       "group_0": {
         "input_activations": {
           "dynamic": true,
           "group_size": null,
           "num_bits": 8,
+          "observer": null,
           "observer_kwargs": {},
           "strategy": "token",
           "symmetric": true,
       }
     },
     "format": "float-quantized",
+    "global_compression_ratio": 1.220698132330407,
     "ignore": [
+      "visual.blocks.0.attn.qkv",
+      "visual.blocks.0.attn.proj",
+      "visual.blocks.0.mlp.fc1",
+      "visual.blocks.0.mlp.fc2",
+      "visual.blocks.1.attn.qkv",
+      "visual.blocks.1.attn.proj",
+      "visual.blocks.1.mlp.fc1",
+      "visual.blocks.1.mlp.fc2",
+      "visual.blocks.2.attn.qkv",
+      "visual.blocks.2.attn.proj",
+      "visual.blocks.2.mlp.fc1",
+      "visual.blocks.2.mlp.fc2",
+      "visual.blocks.3.attn.qkv",
+      "visual.blocks.3.attn.proj",
+      "visual.blocks.3.mlp.fc1",
+      "visual.blocks.3.mlp.fc2",
+      "visual.blocks.4.attn.qkv",
+      "visual.blocks.4.attn.proj",
+      "visual.blocks.4.mlp.fc1",
+      "visual.blocks.4.mlp.fc2",
+      "visual.blocks.5.attn.qkv",
+      "visual.blocks.5.attn.proj",
+      "visual.blocks.5.mlp.fc1",
+      "visual.blocks.5.mlp.fc2",
+      "visual.blocks.6.attn.qkv",
+      "visual.blocks.6.attn.proj",
+      "visual.blocks.6.mlp.fc1",
+      "visual.blocks.6.mlp.fc2",
+      "visual.blocks.7.attn.qkv",
+      "visual.blocks.7.attn.proj",
+      "visual.blocks.7.mlp.fc1",
+      "visual.blocks.7.mlp.fc2",
+      "visual.blocks.8.attn.qkv",
+      "visual.blocks.8.attn.proj",
+      "visual.blocks.8.mlp.fc1",
+      "visual.blocks.8.mlp.fc2",
+      "visual.blocks.9.attn.qkv",
+      "visual.blocks.9.attn.proj",
+      "visual.blocks.9.mlp.fc1",
+      "visual.blocks.9.mlp.fc2",
+      "visual.blocks.10.attn.qkv",
+      "visual.blocks.10.attn.proj",
+      "visual.blocks.10.mlp.fc1",
+      "visual.blocks.10.mlp.fc2",
+      "visual.blocks.11.attn.qkv",
+      "visual.blocks.11.attn.proj",
+      "visual.blocks.11.mlp.fc1",
+      "visual.blocks.11.mlp.fc2",
+      "visual.blocks.12.attn.qkv",
+      "visual.blocks.12.attn.proj",
+      "visual.blocks.12.mlp.fc1",
+      "visual.blocks.12.mlp.fc2",
+      "visual.blocks.13.attn.qkv",
+      "visual.blocks.13.attn.proj",
+      "visual.blocks.13.mlp.fc1",
+      "visual.blocks.13.mlp.fc2",
+      "visual.blocks.14.attn.qkv",
+      "visual.blocks.14.attn.proj",
+      "visual.blocks.14.mlp.fc1",
+      "visual.blocks.14.mlp.fc2",
+      "visual.blocks.15.attn.qkv",
+      "visual.blocks.15.attn.proj",
+      "visual.blocks.15.mlp.fc1",
+      "visual.blocks.15.mlp.fc2",
+      "visual.blocks.16.attn.qkv",
+      "visual.blocks.16.attn.proj",
+      "visual.blocks.16.mlp.fc1",
+      "visual.blocks.16.mlp.fc2",
+      "visual.blocks.17.attn.qkv",
+      "visual.blocks.17.attn.proj",
+      "visual.blocks.17.mlp.fc1",
+      "visual.blocks.17.mlp.fc2",
+      "visual.blocks.18.attn.qkv",
+      "visual.blocks.18.attn.proj",
+      "visual.blocks.18.mlp.fc1",
+      "visual.blocks.18.mlp.fc2",
+      "visual.blocks.19.attn.qkv",
+      "visual.blocks.19.attn.proj",
+      "visual.blocks.19.mlp.fc1",
+      "visual.blocks.19.mlp.fc2",
+      "visual.blocks.20.attn.qkv",
+      "visual.blocks.20.attn.proj",
+      "visual.blocks.20.mlp.fc1",
+      "visual.blocks.20.mlp.fc2",
+      "visual.blocks.21.attn.qkv",
+      "visual.blocks.21.attn.proj",
+      "visual.blocks.21.mlp.fc1",
+      "visual.blocks.21.mlp.fc2",
+      "visual.blocks.22.attn.qkv",
+      "visual.blocks.22.attn.proj",
+      "visual.blocks.22.mlp.fc1",
+      "visual.blocks.22.mlp.fc2",
+      "visual.blocks.23.attn.qkv",
+      "visual.blocks.23.attn.proj",
+      "visual.blocks.23.mlp.fc1",
+      "visual.blocks.23.mlp.fc2",
+      "visual.blocks.24.attn.qkv",
+      "visual.blocks.24.attn.proj",
+      "visual.blocks.24.mlp.fc1",
+      "visual.blocks.24.mlp.fc2",
+      "visual.blocks.25.attn.qkv",
+      "visual.blocks.25.attn.proj",
+      "visual.blocks.25.mlp.fc1",
+      "visual.blocks.25.mlp.fc2",
+      "visual.blocks.26.attn.qkv",
+      "visual.blocks.26.attn.proj",
+      "visual.blocks.26.mlp.fc1",
+      "visual.blocks.26.mlp.fc2",
+      "visual.blocks.27.attn.qkv",
+      "visual.blocks.27.attn.proj",
+      "visual.blocks.27.mlp.fc1",
+      "visual.blocks.27.mlp.fc2",
+      "visual.blocks.28.attn.qkv",
+      "visual.blocks.28.attn.proj",
+      "visual.blocks.28.mlp.fc1",
+      "visual.blocks.28.mlp.fc2",
+      "visual.blocks.29.attn.qkv",
+      "visual.blocks.29.attn.proj",
+      "visual.blocks.29.mlp.fc1",
+      "visual.blocks.29.mlp.fc2",
+      "visual.blocks.30.attn.qkv",
+      "visual.blocks.30.attn.proj",
+      "visual.blocks.30.mlp.fc1",
+      "visual.blocks.30.mlp.fc2",
+      "visual.blocks.31.attn.qkv",
+      "visual.blocks.31.attn.proj",
+      "visual.blocks.31.mlp.fc1",
+      "visual.blocks.31.mlp.fc2",
+      "visual.merger.mlp.0",
+      "visual.merger.mlp.2",
       "lm_head"
     ],
     "kv_cache_scheme": null,
     "quant_method": "compressed-tensors",
     "quantization_status": "compressed"
   },
   "rms_norm_eps": 1e-06,
   "rope_scaling": {
     "mrope_section": [
   "sliding_window": 32768,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
+  "transformers_version": "4.46.0.dev0",
   "use_cache": true,
   "use_sliding_window": false,
   "video_token_id": 151656,

generation_config.json CHANGED Viewed

@@ -9,5 +9,5 @@
   "temperature": 0.01,
   "top_k": 1,
   "top_p": 0.001,
-  "transformers_version": "4.45.0.dev0"
 }

   "temperature": 0.01,
   "top_k": 1,
   "top_p": 0.001,
+  "transformers_version": "4.46.0.dev0"
 }

model-00001-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8f5a686c2b56588155c65b173ef7fd6a2fdc5e350942c32e9a60857630933ee3
+size 4938519208

model-00002-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fa2df119f1ba538ce27b6bfb6c4b3cfcca9d618c5cf37dfae72df81767fc1f98
+size 4031832312

model-00003-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e76ec4dc2e7c0dcbe3432e58fae08e62204a2ef2323069d85c8fa0affb87332a
+size 1089994880

model.safetensors.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

recipe.yaml ADDED Viewed

	@@ -0,0 +1,6 @@

+DEFAULT_stage:
+  DEFAULT_modifiers:
+    QuantizationModifier:
+      ignore: ['re:.*lm_head', 're:visual.*']
+      targets: Linear
+      scheme: FP8_DYNAMIC

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff