阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 441|回复: 6

[科技、报告] 《DeepSeek-R1及类强推理模型开发解读》作者:北京大学 陈博远【PDF】

[复制链接]

用户组:举人

重建论坛勋章

      UID
251
      积分
1172
      回帖
33
      主题
104
      发书数
103
      威望
1000
      铜币
7191
      贡献
0
      阅读权限
50
      注册时间
2025-3-1
      在线时间
145 小时
      最后登录
2026-1-11
发表于 2025-3-5 10:25 | 显示全部楼层 |阅读模式




DeepSeek-R1及类强推理模型开发的解读,由北京大学的陈博远撰写。主要内容涉及模型的技术架构、强化学习(RL)的应用、与其他技术的对比、未来发展方向等。教程一共有76页。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +7 铜币 +17 收起 理由
飞乌与渔 + 7 + 17 补版规更新前的期刊合集

查看全部评分

回复

使用道具 举报

用户组:秀才

      UID
7467
      积分
518
      回帖
394
      主题
1
      发书数
0
      威望
320
      铜币
130
      贡献
0
      阅读权限
40
      注册时间
2025-3-5
      在线时间
132 小时
      最后登录
2026-1-11
发表于 2025-3-6 09:19 | 显示全部楼层
谢谢分享啊,我想看看了啊。
回复

使用道具 举报

用户组:贡士

      UID
5007
      积分
3335
      回帖
5723
      主题
1
      发书数
0
      威望
473
      铜币
2119
      贡献
0
      阅读权限
60
      注册时间
2025-3-3
      在线时间
248 小时
      最后登录
2026-1-11
发表于 2025-3-6 09:23 | 显示全部楼层
清华大学出来了文章,马上北京大学的来了啊。
回复

使用道具 举报

用户组:秀才

      UID
7162
      积分
516
      回帖
582
      主题
1
      发书数
0
      威望
224
      铜币
2118
      贡献
0
      阅读权限
40
      注册时间
2025-3-4
      在线时间
68 小时
      最后登录
2025-12-26
发表于 2025-3-8 20:12 | 显示全部楼层
谢谢分享!
回复

使用道具 举报

用户组:管理员

论坛活动勋章爱心会员勋章重建论坛爱心会员勋章重建论坛勋章管理员勋章

      UID
5
      积分
178539
      回帖
27499
      主题
19568
      发书数
19556
      威望
133049
      铜币
510651
      贡献
2400
      阅读权限
200
      注册时间
2025-2-27
      在线时间
1897 小时
      最后登录
2026-1-11
发表于 2025-5-27 10:39 | 显示全部楼层
感觉已经比较专业了,对于这个我就是比较茫然了~
回复

使用道具 举报

用户组:贡士

重建论坛勋章

      UID
17104
      积分
2364
      回帖
2020
      主题
210
      发书数
201
      威望
1048
      铜币
13462
      贡献
0
      阅读权限
60
      注册时间
2025-5-10
      在线时间
207 小时
      最后登录
2026-1-11
发表于 2025-5-28 11:23 | 显示全部楼层
AI时代,想给孩子找到一个有前途的专业方向可不容易了,很多行业都会受到AI的影响,都说要学会有AI工具,可是AI本身也在迭代进化,总有一天,AI加机器人,人类大概能实现真正的共产主义吧,又或者像终结者那样被机器人消灭。
[发帖际遇]: 破碎信仰 被外星人绑架,赔偿 3 铜币. 幸运榜 / 衰神榜
回复

使用道具 举报

用户组:侍讲

灌水王者

      UID
1376
      积分
20809
      回帖
37601
      主题
15
      发书数
0
      威望
2001
      铜币
31074
      贡献
0
      阅读权限
90
      注册时间
2025-3-1
      在线时间
1529 小时
      最后登录
2026-1-11
发表于 2025-6-11 03:38 | 显示全部楼层
北大另外一个项目组的研究课题了。不过DeepSeek-R1出了那么久了,R2迟迟未到,估计团队内部有些不可言的事情~~~
[发帖际遇]: wkpartner 经过了千辛万苦,捕捉了一只楼主,获得奖励 4 铜币. 幸运榜 / 衰神榜
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2026-1-11 14:07 , Processed in 0.108450 second(s), 32 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表