LM Research - a TheMrCodes Collection

TheMrCodes 's Collections

Point Tracking Models

Interesting Datasets

Read later list

Interesting for LLM Products

Waiting for model weights

Fundamental Research

Knowledge Graph

Bio ML

LM Research

updated Aug 16

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89
Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models

Paper • 2401.01335 • Published Jan 2 • 64
Asynchronous Local-SGD Training for Language Modeling

Paper • 2401.09135 • Published Jan 17 • 9
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention

Paper • 2404.07143 • Published Apr 10 • 103
Streaming Dense Video Captioning

Paper • 2404.01297 • Published Apr 1 • 11
DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search

Paper • 2408.08152 • Published Aug 15 • 51