Spaces:

bstraehle
/

sft

Running

File size: 1,491 Bytes

ac66ae2
cbbb9fd
 
2acdb22
083fde1
a4754dd
c8534fb
251d88f
c8534fb
 
 
251d88f
 
 
 
c8534fb
 
92146e5
cbbb9fd
2acdb22
c8534fb
 
251d88f
 
1c28313
 
 
e66c7c3
92146e5
 
 
c8534fb
 
251d88f
cbbb9fd
251d88f
cbbb9fd
 
 
251d88f
cbbb9fd
0fb434b
251d88f
c8534fb
2b03f9f
 
 
c8534fb
251d88f
2b03f9f
2371111
2b03f9f
083fde1
2371111
6f58fe9
30a3da2
2371111
083fde1

import gradio as gr
import os
from huggingface_hub import HfApi, login
from transformers import AutoTokenizer, AutoModelForCausalLM

# NVidia A10G Large (sleep after 1 hour)

# Model IDs:
# google/gemma-2-9b-it
# meta-llama/Meta-Llama-3-8B-Instruct

# Datasets:
#
#

profile = "bstraehle"

def download_model(model_id):
    tokenizer = AutoTokenizer.from_pretrained(model_id)
    model = AutoModelForCausalLM.from_pretrained(model_id)
    model.save_pretrained(model_id)

    return tokenizer

def download_dataset(dataset):
    return ""
    
def fine_tune_model():
    return ""

def upload_model(model_id, tokenizer):
    model_name = model_id[model_id.rfind('/')+1:]
    model_repo_name = f"{profile}/{model_name}"

    login(token=os.environ["HF_TOKEN"])

    api = HfApi()
    api.create_repo(repo_id=model_repo_name)
    api.upload_folder(
        folder_path=model_id,
        repo_id=model_repo_name
    )

    tokenizer.push_to_hub(model_repo_name)

    return model_repo_name

def process(model_id, dataset):
    tokenizer = download_model(model_id)
    model_repo_name = upload_model(model_id, tokenizer)
    
    return model_repo_name

demo = gr.Interface(fn=process, 
                    inputs=[gr.Textbox(label = "Model ID", value = "meta-llama/Meta-Llama-3-8B-Instruct", lines = 1),
                            gr.Textbox(label = "Dataset", value = "gretelai/synthetic_text_to_sql", lines = 1)],
                    outputs=[gr.Textbox(label = "Completion")])
demo.launch()