Spaces:

yanolja
/

arena

Running

Kang Suhyun commited on Oct 11

Commit

4c0bb84

•

1 Parent(s): 9f68c4f

[#25|#128] Add Llama 3.2 models and available models list (#136)

* [#25|#128] Add Llama 3.2 models and available models list

This PR adds Llama 3.2 models using DeepInfra API.

Also, it adds a list of available models to the UI to help users check what models are available.

* 002

Files changed (2) hide show

app.py +3 -0
model.py +6 -5

app.py CHANGED Viewed

@@ -103,6 +103,9 @@ with gr.Blocks(title="Yanolja Arena", css=css) as app:
         - After you see both results, pick which one you think is better.
       """)
   with gr.Row():
     category_radio = gr.Radio(
         choices=[category.value for category in response.Category],

         - After you see both results, pick which one you think is better.
       """)
+  with gr.Accordion("Available Models", open=False):
+    gr.Markdown("\n".join([f"- {model.name}" for model in supported_models]))
   with gr.Row():
     category_radio = gr.Radio(
         choices=[category.value for category in response.Category],

model.py CHANGED Viewed

@@ -146,17 +146,18 @@ supported_models: List[Model] = [
     Model("gpt-4o-2024-08-06"),
     Model("gpt-4o-mini-2024-07-18"),
     AnthropicModel("claude-3-5-sonnet-20240620"),
-    VertexModel("gemini-1.5-pro-001",
                 vertex_credentials=os.getenv("VERTEX_CREDENTIALS")),
-    VertexModel("gemini-1.5-flash-preview-0514",
                 vertex_credentials=os.getenv("VERTEX_CREDENTIALS")),
     Model("meta-llama/Meta-Llama-3.1-8B-Instruct", provider="deepinfra"),
     Model("meta-llama/Meta-Llama-3.1-70B-Instruct", provider="deepinfra"),
     Model("meta-llama/Meta-Llama-3.1-405B-Instruct", provider="deepinfra"),
     Model("Qwen/Qwen2.5-72B-Instruct", provider="deepinfra"),
-    Model("Qwen/Qwen2-72B-Instruct", provider="deepinfra"),
-    Model("google/gemma-2-9b-it", provider="deepinfra"),
-    Model("google/gemma-2-27b-it", provider="deepinfra"),
 ]

     Model("gpt-4o-2024-08-06"),
     Model("gpt-4o-mini-2024-07-18"),
     AnthropicModel("claude-3-5-sonnet-20240620"),
+    VertexModel("gemini-1.5-pro-002",
                 vertex_credentials=os.getenv("VERTEX_CREDENTIALS")),
+    VertexModel("gemini-1.5-flash-002",
                 vertex_credentials=os.getenv("VERTEX_CREDENTIALS")),
+    Model("google/gemma-2-9b-it", provider="deepinfra"),
+    Model("google/gemma-2-27b-it", provider="deepinfra"),
     Model("meta-llama/Meta-Llama-3.1-8B-Instruct", provider="deepinfra"),
     Model("meta-llama/Meta-Llama-3.1-70B-Instruct", provider="deepinfra"),
     Model("meta-llama/Meta-Llama-3.1-405B-Instruct", provider="deepinfra"),
+    Model("meta-llama/Llama-3.2-3B-Instruct", provider="deepinfra"),
+    Model("meta-llama/Llama-3.2-1B-Instruct", provider="deepinfra"),
     Model("Qwen/Qwen2.5-72B-Instruct", provider="deepinfra"),
 ]