CISCai
/

Mistral-7B-Instruct-v0.3-SOTA-GGUF

Text Generation

Inference Endpoints

Model card Files Files and versions Community

CISCai commited on May 30

Commit

8acad5e

•

1 Parent(s): 65803ed

Fix example parameters

Files changed (1) hide show

README.md +5 -1

README.md CHANGED Viewed

@@ -194,8 +194,10 @@ grammar = LlamaGrammar.from_json_schema(json.dumps({
     }
 }))
-llm = Llama(model_path="./Mistral-7B-Instruct-v0.3.IQ4_XS.gguf", n_gpu_layers=33, n_ctx=32768, temperature=0.0, repeat_penalty=1.1)
 response = llm.create_chat_completion(
       messages = [
         {
           "role": "user",
@@ -228,6 +230,8 @@ response = llm.create_chat_completion(
 print(json.loads(response["choices"][0]["text"]))
 print(llm.create_chat_completion(
       messages = [
         {
           "role": "user",

     }
 }))
+llm = Llama(model_path="./Mistral-7B-Instruct-v0.3.IQ4_XS.gguf", n_gpu_layers=33, n_ctx=32768)
 response = llm.create_chat_completion(
+      temperature = 0.0,
+      repeat_penalty = 1.1,
       messages = [
         {
           "role": "user",
 print(json.loads(response["choices"][0]["text"]))
 print(llm.create_chat_completion(
+      temperature = 0.0,
+      repeat_penalty = 1.1,
       messages = [
         {
           "role": "user",