Bielik-7B-Instruct-v0.1

Running on Zero

djstrong commited on Apr 17

Commit

d079dde

•

1 Parent(s): 7599592

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -69,7 +69,7 @@ tokenizer.pad_token = tokenizer.eos_token
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     device_map="auto",
-    quantization_config=quantization_config,
     attn_implementation="flash_attention_2",
 )
@@ -144,7 +144,8 @@ def predict(message, history, system_prompt, temperature, max_new_tokens, top_k,
         'repetition_penalty':repetition_penalty,
         'top_p':top_p,
         'instruction':instruction,
-        'output':"".join(outputs)
     }
     hfapi.upload_file(
         path_or_fileobj=json.dumps(dd, indent=2, ensure_ascii=False).encode('utf-8'),

 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     device_map="auto",
+    torch_dtype='auto',
     attn_implementation="flash_attention_2",
 )
         'repetition_penalty':repetition_penalty,
         'top_p':top_p,
         'instruction':instruction,
+        'output':"".join(outputs),
+        'precision': 'auto '+str(model.dtype),
     }
     hfapi.upload_file(
         path_or_fileobj=json.dumps(dd, indent=2, ensure_ascii=False).encode('utf-8'),