About

👋 Hi, I'm Xin Xu (许鑫), a 3rd-year Ph.D. in Mathematics student at HKUST, advised by Prof. Can Yang.
🎓 I obtained a Statistics Bachelor's degree from School of Gifted Young (少年班), USTC.

👀 My research interest is LLMs (evluation & post-training, reasoning) and AI for Math 💭.

Education

Ph.D. Sep. 2022 - Present The Hong Kong University of Science and Technology, Clear Water Bay, Hong Kong, China Mathematics, Prof. Can Yang
B.E. Sep. 2018 - Jun. 2022 University of Science and Technology of China, Hefei, Anhui, China. Statistics, School of Gifted Young

Experience

Meituan, LLMs Evaluation Group
Research Intern, May 2024 -- Sept. 2024, Shanghai, China
LLMs Math Reasoning (Evlauation & SFT)

Selected Paper [All]

* equal contribution

Thinking-Free Policy Initialization Makes Distilled Reasoning Models More Effective and Efficient Reasoners
Xin Xu, Cliveb AI, Kai Yang, Tianhao Chen, Yang Wang, Saiyong Yang, Can Yang
ICLR 2026 [Paper] [Code] [Models]
On Predictability of Reinforcement Learning Dynamics for Large Language Models
Yuchen Cai, Ding Cao, Xin Xu, Zijun Yao, Yuqing Huang, Zhenyu Tan, Benyi Zhang, Guiquan Liu, Junfeng Fang
ICLR 2026 [Paper] [Code]
Advancing Multimodal Reasoning Capabilities of Multimodal Large Language Models via Visual Perception Reward
Tong Xiao, Xin Xu, Zhenya Huang, Hongyu Gao, Quan Liu, Qi Liu, Enhong Chen
ICLR 2026 [Paper] [Code]
VerifyBench: Benchmarking Reference-based Reward Systems for Large Language Models
Yuchen Yan, Jin Jiang, Zhenbang Ren, Yijun Li, Xudong Cai, Yang Liu, Xin Xu, Mengdi Zhang, Jian Shao, Yongliang Shen, Jun Xiao, Yueting Zhuang
ICLR 2026 [Paper] [Code]
MathFimer: Enhancing Mathematical Reasoning by Expanding Reasoning Steps through Fill-in-the-Middle Task
Yuchen Yan, Yongliang Shen, Yang Liu, Jin Jiang, Xin Xu, Mengdi Zhang, Jian Shao, Yueting Zhuang
ICLR 2026 [Paper]
GPAS: Accelerating Convergence of LLM Pretraining via Gradient-Preserving Activation Scaling
Tianhao Chen*, Xin Xu*, Zijing Liu, Pengxiang Li, Xinyuan Song, Ajay Kumar Jaiswal, Fan Zhang, Jishan Hu, Yang Wang, Hao Chen, Shizhe Diao, Shiwei Liu, Yu Li, Lu Yin, Can Yang
Neurips 2025 [Paper] [Code]
Safe: Enhancing Mathematical Reasoning in Large Language Models via Retrospective Step-aware Formal Verification
Chengwu Liu, Ye Yuan, Yichun Yin, Yan Xu, Xin Xu, Zaoyu Chen, Yasheng Wang, Lifeng Shang, Qun Liu, Ming Zhang
ACL 2025 main [Paper] [Code]
UGPhysics: A Comprehensive Benchmark for Undergraduate Physics Reasoning with Large Language Models
Xin Xu*, Qiyun Xu*, Tong Xiao, Tianhao Chen, Yuchen Yan, Jiaxin Zhang, Shizhe Diao, Can Yang, Yang Wang
ICML 2025 [Paper] [Code] [data]
UGMathBench: A Diverse and Dynamic Benchmark for Undergraduate-Level Mathematical Reasoning with Large Language Models
Xin Xu*, Jiaxin Zhang*, Tianhao Chen*, Zitong Chao, Jishan Hu, Can Yang
ICLR 2025 [Paper] [Code] [data]
Can LLMs Solve Longer Math Word Problems Better?
Xin Xu*, Tong Xiao*, Zitong Chao, Zhenya Huang, Can Yang, Yang Wang
ICLR 2025 [Paper] [Code]
$S^3$cMath: Spontaneous Step-Level Self-Correction Makes Large Language Models Better Mathematical Reasoners
Yuchen Yan, Jin Jiang, Yang Liu, Yixin Cao, Xin Xu, Xunliang Cai, Jian Shao
AAAI 2025 [Paper]
UCS: A Unified Approach to Cell Segmentation for Subcellular Spatial Transcriptomics
Yuheng Chen, Xin Xu, Xiaomeng Wan, Jiashun Xiao, Can Yang
Small Methods (Q1) [Paper]
Can We Verify Step by Step for Incorrect Answer Detection?
Xin Xu, Shizhe Diao, Can Yang, Yang Wang
IJCAI 2025 [Paper] [Code] [data]

Preprints

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models
Xin Xu, Clive Bai, Kai Yang, Tianhao Chen, Yangkun Chen, Weijie Liu, Hao Chen, Yang Wang, Saiyong Yang, Can Yang
[Paper] [Code] [Datasets & Models]
ORBIT: On-policy Exploration-Exploitation for Controllable Multi-Budget Reasoning
Kun Liang, Clive Bai, Xin Xu, Chenming Tang, Sanwoo Lee, Weijie Liu, Saiyong Yang, Yunfang Wu
[Paper]
EntroPIC: Towards Stable Long-Term Training of LLMs via Entropy Stabilization with Proportional-Integral Control
Kai Yang, Xin Xu, Yangkun Chen, Weijie Liu, Jiafei Lyu, Zichuan Lin, Deheng Ye, Saiyong Yang
[Paper] [Code] [Website]
Double-Checker: Enhancing Reasoning of Slow-Thinking LLMs via Self-Critical Fine-Tuning
Xin Xu*, Tianhao Chen*, Fan Zhang, Wanlong Liu, Pengxiang Li, Ajay Kumar Jaiswal, Yuchen Yan, Jishan Hu, Yang Wang, Hao Chen, Shiwei Liu, Shizhe Diao, Can Yang, Lu Yin
[Paper] [Code]

Award

The 20th HKUST Epsilon Fund Research Award, 2025
HKUST RedBird Academic Excellence Award, 2023;2024
The Hong Kong PhD Fellowship, 2022-Present
Outstanding Undergraduates of Anhui Province, 2022
The Second Prize of Chinese Methemetics Competition, 2019

Academic Services

Conference Reviewer: NeurIPS, ICLR, ACL, EMNLP
Journal Reviewer: Annals of Applied Statistics

Teaching Assistant

Matrix Algebra and Applications at HKUST, 2025.2-2025.5
Calculus at HKUST, 2024.9-2024.12
Sampling at HKUST, 2024.2-2024.5
Applied Statistics at HKUST, 2023.9-2023.12
Calculus at HKUST, 2023.3-2023.5
Probability and Mathematical Statistics at USTC, 2021.9-2022.1
Multivariable Calculus at USTC, 2021.3-2021.7
Mathematical Analysis I at USTC, 2020.9-2021.1

Miscellaneous

I love sports, board games, and Chinese poker.