《2025 大课 付费版 深度强化学习理论与实践 33讲 视频教程》

这门课程价格:20元 ★★★标题写带课件,这种是pdf课件,可免费用ai转PPT,转完后可以编辑,精准度很高

★★★课程标题带ppt的,这是原始ppt ,可以直接编辑

★★★什么都不标的,就是纯视频,学校没给课件

-->-->-->★如果网站里没有您要的课程,加微信可以单独给您找
-->-->-->★诚信经营18年,有任何需求可以加微信沟通

课程大小:7.80G
课程格式:手机平板电脑都可以播放 
社长微信:83162582  (加微75折)
客服微信:125212385  (加微75折)
★★★18年淘宝双皇冠99.9%好评店:http://shop57589855.taobao.com/★淘宝客服:点我咨询自学天堂
  • ★★★本站新加技能:所有视频里面有课件的,都可以单独提取出来ppt或pdf或word
  • ★★★有各种加密的在线视频,也可以破解提取出来mp4
  • ★★★视频来源可以是b站,小红书 ,微信公众号等等,有提取业务加微信83162582

视频介绍 [复制本页地址介绍给朋友~]

  

 
第1.1节 强化学习简介
 
 
 
20分15秒
 
2
 
 
第1.2节 强化学习的模型
 
 
 
1小时21分
 
3
 
 
第1.3节 Gym介绍
 
 
 
44分12秒
 
4
 
 
第2.1节 动态规划
 
 
 
13分58秒
 
5
 
 
第2.2节 值函数和贝尔曼方程
 
 
 
47分51秒
 
6
 
 
第2.3节 策略评估
 
 
 
41分45秒
 
7
 
 
第2.4节 策略改进
 
 
 
44分6秒
 
8
 
 
第2.5节 最优值函数与最优策略
 
 
 
26分51秒
 
9
 
 
第2.6节 值迭代与策略迭代
 
 
 
23分24秒
 
10
 
 
第2.7节 动态规划求解强化学习案例
 
 
 
24分50秒
 
11
 
 
第3.1节 蒙特卡洛法简介
 
 
 
13分58秒
 
12
 
 
第3.2节 蒙特卡洛策略评估
 
 
 
1小时21分
 
13
 
 
第3.3节 蒙特卡洛强化学习
 
 
 
41分50秒
 
14
 
 
第3.4节 异策略蒙特卡洛搜索
 
 
 
1小时13分
 
15
 
 
第4.1节 时序差分策略评估
 
 
 
1小时21分
 
16
 
 
第4.2节 同策略时序差分强化学习
 
 
 
41分40秒
 
17
 
 
第4.3节 异策略时序差分强化学习
 
 
 
32分9秒
 
18
 
 
第4.4节 n步时序差分强化学习
 
 
 
17分24秒
 
19
 
 
第5.1节 从感知机到神经网络
 
 
 
29分6秒
 
20
 
 
第5.2节 深度神经网络
 
 
 
54分56秒
 
21
 
 
第5.3节 激活函数、损失函数和数据预处理
 
 
 
1小时24分
 
22
 
 
第5.4节 Pytorch深度学习
 
 
 
1小时43分
 
23
 
 
第6.1节 线性值函数近似
 
 
 
1小时22分
 
24
 
 
第6.2节 神经网络值函数近似法
 
 
 
1小时2分
 
25
 
 
第6.3节 Double DQN(DDQN)算法
 
 
 
11分27秒
 
26
 
 
第6.4节 Prioritized Repley DQN
 
 
 
23分2秒
 
27
 
 
第6.5节 Dueling DQN算法
 
 
 
16分23秒
 
28
 
 
第7.1节 策略梯度法的基本原理
 
 
 
1小时2分
 
29
 
 
第7.2节 策略梯度定理
 
 
 
27分22秒
 
30
 
 
第7.3节 蒙特卡洛策略梯度法
 
 
 
54分28秒
 
31
 
 
第8.1节 异步优势演员评论员算法
 
 
 
42分12秒
 
32
 
 
第8.2节 深度确定性策略梯度法
 
 
 
32分49秒
 
33
 
 
第8.3节 近端策略优化算法
 
 
 
1小时
 

自学社 蒙ICP备09002309号 Power by: 自学社
Please change your screen resolutidn to1024×768 Total ,
Copyright © 2009-20010 自学社 (www.zxshe.com). all Rights Reserved.
top