Xinlong Wang's picture

12 31

Xinlong Wang

xinlongwang

·

https://xloong.wang/

WXinlong

AI & ML interests

computer vision, foundation model

Recent Activity

updated a collection 27 days ago

liked a model about 1 month ago

BAAI/Emu3-Stage1

authored a paper about 2 months ago

Organizations

xinlongwang's activity

upvoted a paper about 2 months ago

Emu3: Next-Token Prediction is All You Need

Paper • 2409.18869 • Published Sep 27 • 91

upvoted a collection about 2 months ago

Emu3

5 items • Updated 27 days ago • 65

upvoted 2 papers 4 months ago

Diffusion Feedback Helps CLIP See Better

Paper • 2407.20171 • Published Jul 29 • 35

DenseFusion-1M: Merging Vision Experts for Comprehensive Multimodal Perception

Paper • 2407.08303 • Published Jul 11 • 17

upvoted a paper 5 months ago

Unveiling Encoder-Free Vision-Language Models

Paper • 2406.11832 • Published Jun 17 • 49

upvoted 2 papers 10 months ago

EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters

Paper • 2402.04252 • Published Feb 6 • 25

Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model

Paper • 2401.09417 • Published Jan 17 • 59

upvoted a paper 11 months ago

Generative Multimodal Models are In-Context Learners

Paper • 2312.13286 • Published Dec 20, 2023 • 34

upvoted 3 papers about 1 year ago

CapsFusion: Rethinking Image-Text Data at Scale

Paper • 2310.20550 • Published Oct 31, 2023 • 25

JudgeLM: Fine-tuned Large Language Models are Scalable Judges

Paper • 2310.17631 • Published Oct 26, 2023 • 33

3D-GPT: Procedural 3D Modeling with Large Language Models

Paper • 2310.12945 • Published Oct 19, 2023 • 57

upvoted a paper over 1 year ago

Generative Pretraining in Multimodality

Paper • 2307.05222 • Published Jul 11, 2023 • 21