GitBag (Zhaolin Gao)

Collections 1

Papers 3

arxiv:2410.04612

arxiv:2404.16767

arxiv:2402.10886

models 250

datasets 247

GitBag/llama3-ultrafeedback-reasoning-iter_4-1731513485-armo-tokenized_harvard

Viewer • Updated about 16 hours ago • 56.3k • 9

GitBag/llama3-ultrafeedback-reasoning-iter_4-1731513485-armo-tokenized

Viewer • Updated 1 day ago • 56.3k • 6

GitBag/llama3-ultrafeedback-reasoning-iter_4-1731513485-armo

Viewer • Updated 1 day ago • 60.8k • 6

GitBag/llama3-ultrafeedback-reasoning-iter_4-1731513485

Viewer • Updated 1 day ago • 60.8k • 6

GitBag/llama3-ultrafeedback-reasoning-iter_3-1731243878-armo-tokenized_harvard

Viewer • Updated 3 days ago • 57.2k • 12

GitBag/llama3-ultrafeedback-reasoning-iter_3-1731243878-armo-tokenized

Viewer • Updated 3 days ago • 57.2k • 9

GitBag/llama3-ultrafeedback-reasoning-iter_3-1731243878-armo

Viewer • Updated 3 days ago • 60.8k • 11

GitBag/llama3-ultrafeedback-reasoning-iter_3-1731243878

Viewer • Updated 4 days ago • 60.8k • 12

GitBag/llama3-cs3780

Viewer • Updated 5 days ago • 1.6k • 14

GitBag/llama3-ultrafeedback-reasoning-iter_2-1731046941-armo-tokenized_harvard

Viewer • Updated 5 days ago • 57.2k • 14

Zhaolin Gao

AI & ML interests

Organizations

Collections 1

GitBag/gemma-2-9b-it-gsm8k

GitBag/llama-3_1-70b-it-gsm8k

GitBag/gemma-2-27b-it-gsm8k

GitBag/llama-3-8b-it-gsm8k

Papers 3

models 250

GitBag/reasoning_rebel_iter_4_1731513485_eta_1e4_lr_3e-7_1731719519

GitBag/reasoning_rebel_iter_4_1731513485_eta_1e3_lr_3e-7_1731714556

GitBag/reasoning_rebel_iter_4_1731513485_eta_1e2_lr_3e-7_1731709582

GitBag/reasoning_rebel_iter_4_1731513485_eta_1e1_lr_3e-7_1731686912

GitBag/reasoning_rebel_iter_3_1731243878_eta_1e5_lr_3e-7_1731523653

GitBag/reasoning_rebel_iter_3_1731243878_eta_1e6_lr_3e-7_1731528705

GitBag/reasoning_rebel_iter_3_1731243878_eta_1e4_lr_3e-7_1731518535

GitBag/reasoning_rebel_iter_3_1731243878_eta_1e3_lr_3e-7_1731513485

GitBag/reasoning_rebel_iter_3_1731243878_eta_1e2_lr_3e-7_1731508404

GitBag/reasoning_rebel_iter_3_1731243878_eta_1e1_lr_3e-7_1731485433

datasets 247

GitBag/llama3-ultrafeedback-reasoning-iter_4-1731513485-armo-tokenized_harvard

GitBag/llama3-ultrafeedback-reasoning-iter_4-1731513485-armo-tokenized

GitBag/llama3-ultrafeedback-reasoning-iter_4-1731513485-armo

GitBag/llama3-ultrafeedback-reasoning-iter_4-1731513485

GitBag/llama3-ultrafeedback-reasoning-iter_3-1731243878-armo-tokenized_harvard

GitBag/llama3-ultrafeedback-reasoning-iter_3-1731243878-armo-tokenized

GitBag/llama3-ultrafeedback-reasoning-iter_3-1731243878-armo

GitBag/llama3-ultrafeedback-reasoning-iter_3-1731243878

GitBag/llama3-cs3780

GitBag/llama3-ultrafeedback-reasoning-iter_2-1731046941-armo-tokenized_harvard

Zhaolin Gao

AI & ML interests

Organizations

Collections 1

Papers 3

models 250 Sort: Recently updated

datasets 247 Sort: Recently updated

models 250

datasets 247