Spaces:

bstraehle
/

sft

Running

bstraehle commited on Jul 5

Commit

cbf9d56

•

1 Parent(s): f6dc51b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,9 +9,11 @@ import evaluate
 import numpy as np
 import random
 def preprocess_function(examples):
     return tokenizer(examples["text"], padding="max_length", truncation=True)
 def process(model_id, dataset):
     # Step 1: Load dataset
     dataset_imdb = load_dataset(dataset)
@@ -37,7 +39,7 @@ def process(model_id, dataset):
     # Step 3: Text tokenization
-    tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
     # Step 4: Apply tokenization to dataset

 import numpy as np
 import random
+tokenizer = None
 def preprocess_function(examples):
     return tokenizer(examples["text"], padding="max_length", truncation=True)
 def process(model_id, dataset):
     # Step 1: Load dataset
     dataset_imdb = load_dataset(dataset)
     # Step 3: Text tokenization
+    global tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
     # Step 4: Apply tokenization to dataset