luokai's picture

26 105

luokai

iamluokai

·

iamluokai

AI & ML interests

None yet

Organizations

None yet

iamluokai's activity

upvoted a collection 4 days ago

LongVU

7 items • Updated 5 days ago • 24

upvoted a paper 12 days ago

Framer: Interactive Frame Interpolation

Paper • 2410.18978 • Published 12 days ago • 35

upvoted a collection about 1 month ago

Molmo

Artifacts for open multimodal language models. • 5 items • Updated Sep 26 • 268

upvoted 2 papers about 2 months ago

LVCD: Reference-based Lineart Video Colorization with Diffusion Models

Paper • 2409.12960 • Published Sep 19 • 22

Seed-Music: A Unified Framework for High Quality and Controlled Music Generation

Paper • 2409.09214 • Published Sep 13 • 46

upvoted a collection 2 months ago

Jamba-1.5

The AI21 Jamba family of models are state-of-the-art, hybrid SSM-Transformer instruction following foundation models • 2 items • Updated Aug 22 • 80

upvoted a paper 3 months ago

HeadGAP: Few-shot 3D Head Avatar via Generalizable Gaussian Priors

Paper • 2408.06019 • Published Aug 12 • 13

upvoted a paper 4 months ago

SpreadsheetLLM: Encoding Spreadsheets for Large Language Models

Paper • 2407.09025 • Published Jul 12 • 128

upvoted a collection 4 months ago

H2O Danube3

6 items • Updated 20 days ago • 53

upvoted 2 papers 5 months ago

Look Once to Hear: Target Speech Hearing with Noisy Examples

Paper • 2405.06289 • Published May 10 • 3

CraftsMan: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner

Paper • 2405.14979 • Published May 23 • 15

upvoted a paper 6 months ago

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22 • 251

upvoted an article 6 months ago

Article

How to Finetune phi-3 on MacBook Pro

By

•

Apr 24

• 63

upvoted 6 papers 7 months ago

MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs

Paper • 2402.15627 • Published Feb 23 • 34

Dynamic Typography: Bringing Words to Life

Paper • 2404.11614 • Published Apr 17 • 43

COCONut: Modernizing COCO Segmentation

Paper • 2404.08639 • Published Apr 12 • 27

Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models

Paper • 2404.07973 • Published Apr 11 • 30

SpatialTracker: Tracking Any 2D Pixels in 3D Space

Paper • 2404.04319 • Published Apr 5 • 23

Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs

Paper • 2404.05719 • Published Apr 8 • 80

upvoted a paper 8 months ago

Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models

Paper • 2402.17177 • Published Feb 27 • 88