Lei Wang's picture

2 95

Lei Wang

demolei

·

https://demoleiwang.github.io/HomePage/

AI & ML interests

LLMs

Recent Activity

upvoted a paper 1 day ago

upvoted a paper 3 days ago

upvoted a paper 3 days ago

Organizations

demolei's activity

upvoted a paper 1 day ago

Adaptive Decoding via Latent Preference Optimization

Paper • 2411.09661 • Published 7 days ago • 10

upvoted 2 papers 3 days ago

Can sparse autoencoders be used to decompose and interpret steering vectors?

Paper • 2411.08790 • Published 8 days ago • 8

LLaVA-o1: Let Vision Language Models Reason Step-by-Step

Paper • 2411.10440 • Published 6 days ago • 87

upvoted 4 papers 8 days ago

Stronger Models are NOT Stronger Teachers for Instruction Tuning

Paper • 2411.07133 • Published 10 days ago • 28

Large Language Models Can Self-Improve in Long-context Reasoning

Paper • 2411.08147 • Published 9 days ago • 58

Chinese SimpleQA: A Chinese Factuality Evaluation for Large Language Models

Paper • 2411.07140 • Published 10 days ago • 33

M-Longdoc: A Benchmark For Multimodal Super-Long Document Understanding And A Retrieval-Aware Tuning Framework

Paper • 2411.06176 • Published 12 days ago • 44

upvoted 5 papers 10 days ago

Large Language Models Orchestrating Structured Reasoning Achieve Kaggle Grandmaster Level

Paper • 2411.03562 • Published 16 days ago • 60

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published 14 days ago • 108

DELIFT: Data Efficient Language model Instruction Fine Tuning

Paper • 2411.04425 • Published 15 days ago • 9

Language Models are Hidden Reasoners: Unlocking Latent Reasoning Capabilities via Self-Rewarding

Paper • 2411.04282 • Published 15 days ago • 30

IOPO: Empowering LLMs with Complex Instruction Following via Input-Output Preference Optimization

Paper • 2411.06208 • Published 12 days ago • 18

upvoted a paper 14 days ago

Both Text and Images Leaked! A Systematic Analysis of Multimodal LLM Data Contamination

Paper • 2411.03823 • Published 15 days ago • 43

upvoted a paper 18 days ago

Unpacking SDXL Turbo: Interpreting Text-to-Image Models with Sparse Autoencoders

Paper • 2410.22366 • Published 24 days ago • 73

upvoted 2 papers 21 days ago

Language Models can Self-Lengthen to Generate Long Texts

Paper • 2410.23933 • Published 21 days ago • 16

What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective

Paper • 2410.23743 • Published 22 days ago • 59

upvoted a paper 22 days ago

CLEAR: Character Unlearning in Textual and Visual Modalities

Paper • 2410.18057 • Published 29 days ago • 199

upvoted 3 papers 23 days ago

Flow-DPO: Improving LLM Mathematical Reasoning through Online Multi-Agent Learning

Paper • 2410.22304 • Published 23 days ago • 15

Fast Best-of-N Decoding via Speculative Rejection

Paper • 2410.20290 • Published 26 days ago • 9

A Survey of Small Language Models

Paper • 2410.20011 • Published 27 days ago • 37