Spaces:

bstraehle
/

sft

Running

bstraehle commited on Aug 3

Commit

c187ecc

•

1 Parent(s): feeba3d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -40,9 +40,8 @@ def fine_tune_model(base_model_id, dataset):
     model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
-    if tokenizer.pad_token is None:
-        tokenizer.add_special_tokens({"pad_token": "[PAD]"})
-        model.resize_token_embeddings(len(tokenizer))
     # Preprocess the dataset
     def preprocess(examples):
@@ -58,7 +57,7 @@ def fine_tune_model(base_model_id, dataset):
     # Set training arguments
     training_args = Seq2SeqTrainingArguments(
         output_dir="./results",
-        num_train_epochs=3,  # Adjust as needed
         per_device_train_batch_size=16,
         per_device_eval_batch_size=64,
         warmup_steps=500,

     model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
+    if not tokenizer.pad_token:
+        tokenizer.pad_token = tokenizer.eos_token
     # Preprocess the dataset
     def preprocess(examples):
     # Set training arguments
     training_args = Seq2SeqTrainingArguments(
         output_dir="./results",
+        num_train_epochs=1,  # Adjust as needed
         per_device_train_batch_size=16,
         per_device_eval_batch_size=64,
         warmup_steps=500,