Intel
/

neural-chat-7b-v3

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

lvkaokao commited on Nov 17, 2023

Commit

7cc4991

•

1 Parent(s): 830e8d3

update hyper-parameters

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -34,8 +34,8 @@ The following hyperparameters were used during training:
 - total_train_batch_size: 64
 - total_eval_batch_size:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
-- lr_scheduler_type: linear
-- lr_scheduler_warmup_ratio: 0.02
 - num_epochs: 2.0
 ## FP32 Inference with transformers

 - total_train_batch_size: 64
 - total_eval_batch_size:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: cosine
+- lr_scheduler_warmup_ratio: 0.03
 - num_epochs: 2.0
 ## FP32 Inference with transformers