Spaces:

gregH
/

gradient_cuff

Sleeping

gregH commited on Aug 22

Commit

d4f4fa0

•

1 Parent(s): 95469bd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -42,13 +42,21 @@ def get_labels(response_list):
 print(f"Starting to load the model to memory")
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
 m = AutoModelForCausalLM.from_pretrained(
-    "google/gemma-2b-it", torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32, trust_remote_code=True)
 embedding_func=m.get_input_embeddings()
 embedding_func.weight.requires_grad=False
 m = m.to(device)
-tok = AutoTokenizer.from_pretrained("google/gemma-2b-it", trust_remote_code=True)
 tok.padding_side = "left"
 tok.pad_token_id = tok.eos_token_id
 # using CUDA for an optimal experience

 print(f"Starting to load the model to memory")
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+HF_TOKEN = os.environ.get("HF_TOKEN")
 m = AutoModelForCausalLM.from_pretrained(
+    "google/gemma-2b-it",
+    torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32,
+    trust_remote_code=True,token=HF_TOKEN
+)
 embedding_func=m.get_input_embeddings()
 embedding_func.weight.requires_grad=False
 m = m.to(device)
+tok = AutoTokenizer.from_pretrained("google/gemma-2b-it",
+                                    trust_remote_code=True,token=HF_TOKEN
+                                   )
 tok.padding_side = "left"
 tok.pad_token_id = tok.eos_token_id
 # using CUDA for an optimal experience