1 5 11

Niels Horn

nilq

https://niels.ninja

nilq

AI & ML interests

Natural language understanding, synthetic emotional speech, mechanistic interpretability.

Recent Activity

updated a collection about 1 month ago

Dynamics of Transformer Language Model Features

updated a model about 1 month ago

nilq/baby-python-mistral-1L-tiny-TinyStories-ft

updated a model about 1 month ago

nilq/baby-python-mistral-1L-tiny-lua-ft

Organizations

Collections 4

Papers 1

arxiv:2410.12391

models 16

datasets 9

nilq/baby-python-and-tiny-stories-and-lua

Viewer • Updated Apr 14 • 12.3M • 51

nilq/baby-python-and-lua

Viewer • Updated Apr 8 • 12.3M • 55 • 1

nilq/baby-python-and-tiny-stories

Viewer • Updated Apr 8 • 13.9M • 44

nilq/python-and-tiny-stories

Updated Apr 8 • 4

nilq/baby-python

Viewer • Updated Mar 16 • 11.7M • 81 • 1

nilq/small-lua-stack

Viewer • Updated Feb 28 • 559k • 56 • 2

nilq/small-python-stack

Viewer • Updated Feb 28 • 2.59M • 77

nilq/babylm-100M

Viewer • Updated Jan 21 • 12.7M • 52

nilq/babylm-10M

Viewer • Updated Jan 21 • 3.14M • 64

Niels Horn

AI & ML interests

Recent Activity

Organizations

Collections 4

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

Diverse Weight Averaging for Out-of-Distribution Generalization

Fusing finetuned models for better pretraining

Sudden Drops in the Loss: Syntax Acquisition, Phase Transitions, and Simplicity Bias in MLMs

nilq/lua-mistral-1L-mini

nilq/mistral-1L-mini

nilq/mistral-1L-tiny

nilq/lua-mistral-1L-tiny

Papers 1

models 16

nilq/baby-python-mistral-1L-tiny-TinyStories-ft

nilq/baby-python-mistral-1L-tiny-lua-ft

nilq/baby-python-1L-mistral-lua-stories-slerp

nilq/baby-python-mistral-1L-tiny-base

nilq/lua-stories-slerp-mistral-1L-tiny

nilq/lua-stories-slerp-mistral-2L-tiny

nilq/mistral-2L-tiny

nilq/lua-stories-linear-mistral-1L-tiny

nilq/python-mistral-1L-mini

nilq/mistral-1L-tiny

datasets 9

nilq/baby-python-and-tiny-stories-and-lua

nilq/baby-python-and-lua

nilq/baby-python-and-tiny-stories

nilq/python-and-tiny-stories

nilq/baby-python

nilq/small-lua-stack

nilq/small-python-stack

nilq/babylm-100M

nilq/babylm-10M

Niels Horn

AI & ML interests

Recent Activity

Organizations

Collections 4

Papers 1

models 16 Sort: Recently updated

datasets 9 Sort: Recently updated

models 16

datasets 9