Hongyu Wang's picture

Hongyu Wang

hongyuw

·

https://ustcwhy.github.io/

ustcwhy

AI & ML interests

DL, CV, NLP

Organizations

hongyuw's activity

upvoted a paper 2 days ago

BitNet a4.8: 4-bit Activations for 1-bit LLMs

Paper • 2411.04965 • Published 2 days ago • 50

upvoted a paper 8 days ago

Self-Boosting Large Language Models with Synthetic Preference Data

Paper • 2410.06961 • Published Oct 9 • 15

upvoted 2 papers 23 days ago

VidEgoThink: Assessing Egocentric Video Understanding Capabilities for Embodied AI

Paper • 2410.11623 • Published 26 days ago • 46

HumanEval-V: Evaluating Visual Understanding and Reasoning Abilities of Large Multimodal Models Through Coding Tasks

Paper • 2410.12381 • Published 25 days ago • 41

upvoted a paper about 1 month ago

Differential Transformer

Paper • 2410.05258 • Published Oct 7 • 165

upvoted a paper 4 months ago

Q-Sparse: All Large Language Models can be Fully Sparsely-Activated

Paper • 2407.10969 • Published Jul 15 • 20

upvoted a paper 9 months ago

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27 • 602

upvoted 3 papers 10 months ago

Mixtral of Experts

Paper • 2401.04088 • Published Jan 8 • 157

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

Paper • 2401.02954 • Published Jan 5 • 40

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

Paper • 2311.16502 • Published Nov 27, 2023 • 35

upvoted a paper 11 months ago

VideoPoet: A Large Language Model for Zero-Shot Video Generation

Paper • 2312.14125 • Published Dec 21, 2023 • 44

upvoted a paper about 1 year ago

BitNet: Scaling 1-bit Transformers for Large Language Models

Paper • 2310.11453 • Published Oct 17, 2023 • 96

upvoted a paper over 1 year ago

Kosmos-2: Grounding Multimodal Large Language Models to the World

Paper • 2306.14824 • Published Jun 26, 2023 • 34