新闻中心

· Light-R1:低成本复现推理模型之路|360智脑算法资深专家邹昊晟演讲预告 ·

2025年4月1-2日,2025中国生成式AI大会(北京站)将在北京中关村东升科技园万丽酒店举行。中国生成式AI大会已成功举办三届,现已成为国内人工智能领域最具影响力的产业峰会之一。

本次大会继续由智一科技旗下智猩猩、智东西共同发起,以“大拐点 新征程”为主题,计划邀请50+位重量级嘉宾同台分享和讨论,深入透视DeepSeek带来的颠覆与重构,全面展示国内生成式AI重大进展。

大会主会场将进行开幕式、GenAI应用论坛、大模型峰会;分会场将进行DeepSeek R1与推理模型技术研讨会、AI智能体技术研讨会和具身智能大模型技术研讨会。其中,三场研讨会为闭门制,主要面向持有闭门专享票、贵宾通票的观众开放。大会同期也设有展区,将展示工业界在大模型、GenAI应用等产业关键环节的优秀产品和解决方案。

在大会首日下午分会场进行的DeepSeek R1与推理模型技术研讨会上,360智脑算法资深专家邹昊晟将带来报告,主题为《Light-R1:低成本复现推理模型之路》。

嘉宾介绍

邹昊晟博士现任360智脑算法资深专家,主导了开源项目Light-R1和360-LLaMA-Factory。他博士毕业于清华大学TSAIL朱军教授组,本科毕业于清华大学电子系。在大模型之前历任米哈游和第四范式的强化学习研究员,是TF版tianshou的作者。

报告概要

360智脑在3月4日开源了Light-R1模型及全部训练数据和代码,用较低的训练成本即可从零训练得到推理模型,在开源时首次实现领域内评测超越DeepSeek-R1-Distill。报告将介绍Light-R1背后的课程学习SFT、RFT、DPO等方法上的数据心得和训练策略,和QwQ-32B、TinyR1等相关工作在训练资源、方法等各方面的比较。虽然Light-R1仅使用数学数据训练了模型的长推理能力,但在非数学任务上也表现出了泛化性及有效性。随着训练和推理技术的不断发展,未来长推理模型将更加普及,Light-R1 正为低成本快速训练一个领域专精推理模型提供了重要参考。

大会日程

报名方式

DeepSeek R1与推理模型技术研讨会将在大会首日分会场下午进行,主要向持有闭门专享票、贵宾通票的观众开放。

希望参加研讨会的朋友,可以扫描下方二维码,添加小助手“泡泡”咨询和购票。已添加过“泡泡”的老朋友,给“泡泡”私信,发送“GenAICon25”即可。

除了闭门专享票、贵宾通票,大会还设有主会场观众票、主会场VIP票,在主会场的座位分布如下。有需要的朋友可以进行免费申请或购买。

格尔软件旗下众多安全产品,邀您体验

了解更多