feat: add GLM-5 SFT loss mask support by stevewx · Pull Request #1824 · THUDM/slime

stevewx · 2026-04-10T00:50:18Z

Summary

Add --loss-mask-type glm5 for multi-turn SFT on GLM-5 models
GLM-5 uses role-token delimiters (<|assistant|>, <|user|>, etc.) with no closing tags, unlike Qwen's ChatML <|im_start|>/<|im_end|> format
Handles both </think> (non-thinking) and <think>...</think> (thinking) modes
Supports step_loss_mask per-turn control and tool-calling via <|observation|> role

slime/utils/mask_utils.py — add gen_multi_turn_loss_mask_glm5() method using char-level offset mapping
slime/utils/arguments.py — add "glm5" to --loss-mask-type choices
tests/utils/test_loss_mask_type_glm5.py — 7 unit tests covering single-turn, multi-turn, step_loss_mask, tool calling, tool schemas, no-system-message, and length consistency

7 unit tests pass locally (pytest tests/utils/test_loss_mask_type_glm5.py)
Existing Qwen3.5 tests unaffected (pytest tests/utils/test_loss_mask_type_qwen35.py)
Verified against real GLM-5 tokenizer (zai-org/GLM-5)
Tested GLM-5 SFT training with OpenHermes-2.5

stevewx · 2026-04-21T05:46:46Z

closed in favor of #1844

feat: add GLM-5 SFT loss mask support (--loss-mask-type glm5)

617ffdd

stevewx marked this pull request as ready for review April 10, 2026 01:06

stevewx mentioned this pull request Apr 20, 2026

Add GLM5 SFT support #1844

Open

stevewx closed this Apr 21, 2026