Quick answer

5-Thinking, capable of reasoning through thinking before responding, resulting in improved performance on a wide range of benchmarks. 3 on GPQA, demonstrating excellent reasoning abilities in STEM and coding.

Paper2025-04-29•Source ↗•10 attns0 checkouts

Claim

Seed1.5-Thinking: Advancing Superb Reasoning Models with Reinforcement Learning

Authors

Discuss with Grok

ByteDance Seed·

:·

Jiaze Chen·

Tiantian Fan·

Xin Liu·

Lingjun Liu·

Zhiqi Lin·

Mingxuan Wang·

Chengyi Wang·

Xiangpeng Wei·

Wenyuan Xu·

Yufeng Yuan·

Yu Yue·

Lin Yan·

Qiying Yu·

Xiaochen Zuo·

Chi Zhang·

Ruofei Zhu·

Zhecheng An·

Zhihao Bai·

Yu Bao·

Xingyan Bin·

Jiangjie Chen·

Feng Chen·

Hongmin Chen·

Riwei Chen·

Liangqiang Chen·

Zixin Chen·

Jinsong Chen·

Siyan Chen·

Kaiyuan Chen·

Zhi Chen·

Jin Chen·

Jiecao Chen·

Jinxin Chi·

Weinan Dai·

Ning Dai·

Jiahui Dai·

Shihan Dou·

Yantao Du·

Zhengyin Du·

Jianhui Duan·

Chen Dun·

Ting-Han Fan·

Jiazhan Feng·

Junda Feng·

Ziyuan Feng·

Yuwei Fu·

Wenqi Fu·

Hanjie Fu·

Hao Ge·

Hongyi Guo·

Mingji Han·

Li Han·

Wenhao Hao·

Xintong Hao·

Qianyu He·

Jerry He·

Feng He·

Wen Heng·

Zehua Hong·

Qi Hou·

Liang Hu·

Shengding Hu·

Nan Hu·

Kai Hua·

Qi Huang·

Ziyue Huang·

Hongzhi Huang·

Zihao Huang·

Ting Huang·

Wenhao Huang·

Wei Jia·

Bin Jia·

Xiaoying Jia·

Yuhua Jiang·

Haobin Jiang·

Ziheng Jiang·

Kaihua Jiang·

Chengquan Jiang·

Jianpeng Jiao·

Xiaoran Jin·

Xing Jin·

Xunhao Lai·

Zheng Li·

Xiang Li·

Liyi Li·

Hongkai Li·

Shengxian Wan·

Ya Wang·

Yunshui Li·

Chenggang Li·

Niuniu Li·

Siyu Li·

Xi Li·

Xiao Li·

Aoyan Li·

Yuntao Li·

Nianning Liang·

Xinnian Liang·

Haibin Lin·

Weijian Lin·

Ye Lin·

Zhicheng Liu·

Guanlin Liu·

Chenxiao Liu·

Yan Liu·

Gaohong Liu·

Juncai Liu·

Chundian Liu·

Deyi Liu·

Kaibo Liu·

Siyao Liu·

Qi Liu·

Yongfei Liu·

Kang Liu·

Gan Liu·

Boyi Liu·

Rui Long·

Weiqiang Lou·

Chenwei Lou·

Xiang Luo·

Yao Luo·

Caiping Lv·

Heyang Lv·

Bole Ma·

Qianli Ma·

Hongzhi Ma·

Yiyuan Ma·

Jin Ma·

Wenchang Ma·

Tingting Ma·

Chen Mao·

Qiyang Min·

Zhe Nan·

Guanghan Ning·

Jinxiang Ou·

Haojie Pan·

Renming Pang·

Yanghua Peng·

Tao Peng·

Lihua Qian·

Mu Qiao·

Meng Qu·

Cheng Ren·

Hongbin Ren·

Yong Shan·

Wei Shen·

Ke Shen·

Kai Shen·

Guangming Sheng·

Jinlong Shi·

Wenlei Shi·

Guang Shi·

Shuai Shuai Cao·

Yuxin Song·

Zuquan Song·

Jing Su·

Yifan Sun·

Tao Sun·

Zewei Sun·

Borui Wan·

Zihan Wang·

Xiaohui Wang·

Xi Wang·

Shuguang Wang·

Jun Wang·

Qinlong Wang·

Chenyuan Wang·

Shuai Wang·

Changbao Wa

ABSTRACT

We introduce Seed1.5-Thinking, capable of reasoning through thinking before responding, resulting in improved performance on a wide range of benchmarks. Seed1.5-Thinking achieves 86.7 on AIME 2024, 55.0 on Codeforces and 77.3 on GPQA, demonstrating excellent reasoning abilities in STEM and coding. Beyond reasoning tasks, the method demonstrates notable generalization across diverse domains. For instance, it surpasses DeepSeek R1 by 8% in win rate on non-reasoning tasks, indicating its broader applicability. Compared to other state-of-the-art reasoning models, Seed1.5-Thinking is a Mixture-of-Experts (MoE) model with a relatively small size, featuring 20B activated and 200B total parameters. As part of our effort to assess generalized reasoning, we develop two internal benchmarks, BeyondAIME and Codeforces, both of which will be publicly released to support future research. Model trial link: https://www.volcengine.com/experience/ark.

#computer-version/year/2025 #llm/paper/year/2025 #computer-version #multimodal-model #computer-version/month/202504 #llm/month/202504 #llm/paper/month/202504 #llm/paper #deep-learning/from/bytedance-research #deep-learning/year/2025 #llm/year/2025 #world-model #deep-learning #llm #deep-learning/month/202504 ByteDance Research

Review Snapshot

Explore ratings

0.0

★★★★★

0 ratings

5 star

4 star

3 star

2 star

1 star

Recommendation

recommend this content.

Review this content

Share your opinion to help other learners triage faster.

Write a review

Invite a reviewer

Invite someone by email to share an invited review for Seed1.5-Thinking: Advancing Superb Reasoning Models with Reinforcement Learning.

Author Inquiries

Public questions about this content. Attendemia will route your question to the author. Vote on the most important ones. No guarantee of response.

Post an inquiry

Sort by: Most helpful