Skywork-Reward-Model - a Skywork Collection

Skywork 's Collections

Skywork-Reward-Model

Skywork-Reward-Data-Collection

Skywork-Critic-Models

Skywork-Reward-Model

updated 25 days ago

Skywork reward model series

Skywork-Reward: Bag of Tricks for Reward Modeling in LLMs

Paper • 2410.18451 • Published 29 days ago • 13
Skywork/Skywork-Reward-Gemma-2-27B-v0.2

Text Classification • Updated 28 days ago • 3.07k • 17

Note A new version of our 27B reward model trained on Skywork-Reward-Preference-80K-v0.2, the decontaminated version of Skywork-Reward-Preference-80K-v0.1
Skywork/Skywork-Reward-Llama-3.1-8B-v0.2

Text Classification • Updated 28 days ago • 246k • 14

Note A new version of our 8B reward model trained on Skywork-Reward-Preference-80K-v0.2, the decontaminated version of Skywork-Reward-Preference-80K-v0.1
Skywork/Skywork-Reward-Gemma-2-27B

Text Classification • Updated 28 days ago • 1.26k • 37
Skywork/Skywork-Reward-Llama-3.1-8B

Text Classification • Updated 28 days ago • 3.16k • 27