LLM Fundamental papers - a elichen3051 Collection

elichen3051 's Collections

LLM Fundamental papers

My interested papers - LLM

LLM Fundamental papers

updated Jun 8

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 44

Note Transformer
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 11

Note GPT-3
GQA: Training Generalized Multi-Query Transformer Models from Multi-Head Checkpoints

Paper • 2305.13245 • Published May 22, 2023 • 5
Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 242
Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 87
Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22 • 251
GPT-4 Technical Report

Paper • 2303.08774 • Published Mar 15, 2023 • 5
Training language models to follow instructions with human feedback

Paper • 2203.02155 • Published Mar 4, 2022 • 15

Note RLHF
Direct Preference Optimization: Your Language Model is Secretly a Reward Model

Paper • 2305.18290 • Published May 29, 2023 • 47

Note DPO
Statistical Rejection Sampling Improves Preference Optimization

Paper • 2309.06657 • Published Sep 13, 2023 • 13

Note Rejection Sampling
RoFormer: Enhanced Transformer with Rotary Position Embedding

Paper • 2104.09864 • Published Apr 20, 2021 • 10

Note ROPE