TED Vortex

0-vortex

AI & ML interests

None yet

Recent Activity

liked a model 17 minutes ago

Qwen/Qwen2.5-Coder-32B-Instruct

upvoted a paper 21 days ago

liked a model 26 days ago

RichardErkhov/nisten_-_BigCodeLlama-92b-gguf

Organizations

None yet

0-vortex's activity

upvoted a paper 21 days ago

GPT-4o System Card

Paper • 2410.21276 • Published 27 days ago • 79

upvoted a paper 3 months ago

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search

Paper • 2408.08152 • Published Aug 15 • 52

upvoted a collection 3 months ago

Hermes 3

Collection

The Hermes 3 Series of Models • 8 items • Updated Aug 23 • 91

upvoted 2 papers 3 months ago

Your Context Is Not an Array: Unveiling Random Access Limitations in Transformers

Paper • 2408.05506 • Published Aug 10 • 8

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

Paper • 2408.06292 • Published Aug 12 • 115

upvoted an article 3 months ago

Article

Introduction to ggml

Aug 13

• 113

upvoted 8 papers 4 months ago

Case2Code: Learning Inductive Reasoning with Synthetic Data

Paper • 2407.12504 • Published Jul 17 • 7

LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models

Paper • 2407.12772 • Published Jul 17 • 33

GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression

Paper • 2407.12077 • Published Jul 16 • 54

AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases

Paper • 2407.12784 • Published Jul 17 • 48

Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models

Paper • 2407.12327 • Published Jul 17 • 77

Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion

Paper • 2407.10973 • Published Jul 15 • 9

GTA: A Benchmark for General Tool Agents

Paper • 2407.08713 • Published Jul 11 • 14

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 156

upvoted an article 4 months ago

Article

Uncensor any LLM with abliteration

•

Jun 13

• 369

upvoted a paper 4 months ago

MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?

Paper • 2407.04842 • Published Jul 5 • 52

upvoted 2 papers 5 months ago

TroL: Traversal of Layers for Large Language and Vision Models

Paper • 2406.12246 • Published Jun 18 • 34

LLaNA: Large Language and NeRF Assistant

Paper • 2406.11840 • Published Jun 17 • 17

upvoted a paper 7 months ago

Reka Core, Flash, and Edge: A Series of Powerful Multimodal Language Models

Paper • 2404.12387 • Published Apr 18 • 38

upvoted a paper 10 months ago

DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence

Paper • 2401.14196 • Published Jan 25 • 47