boots-coder

Follow

👋

I may be slow to respond.

haoxuanJIA boots-coder

👋

I may be slow to respond.

Follow

a student in NTU

7 followers · 22 following

Highlights

Pro

Pinned Loading

stanford-cs234 stanford-cs234 Public

Forked from tallamjr/stanford-cs234

Stanford CS234 : Reinforcement Learning

Python
lumen lumen Public

Python 14
zhouyi-agent zhouyi-agent Public

Python
THUDM/slime THUDM/slime Public

slime is an LLM post-training framework for RL Scaling.

Python 5.7k 799
LLM-101-CN LLM-101-CN Public

JavaScript 14 2