课程两种分类导航
本类课程推荐
- 带课件 山西工程职业技术学院 集散控制系统..
- 带课件习题 成都航空职业技术学院 冲压模具..
- 带课件习题 上海中医药大学 针灸学 108讲 主..
- 带课件习题 江西环境工程职业学院 家具生产..
- 四川大学 中国古代文学 上下册 68讲 视频教..
- 带课件 习题山东科技大学 矿井通风与安全 6..
- 带课件习题 中国科技大学 并行计算 视频 手..
- 带课件习题 第四军医大学 外科学 238讲 主编..
- 带课件习题 湖南铁道职业技术学院 电力机车..
- 带课件习题 四川大学 英汉口译 98讲 任文 主..
- 上海财经大学 会计学 37讲 +2019年 52讲 主..
- 带课件 电子书 习题 试卷 答案 61讲 厦门大..
- 华中科技大学 建设法规 建筑法规 31讲 视频..
- 带课件 苏州大学 马克思主义哲学 37讲 马克..
- 带课件习题试卷 中科大 天体物理概论 27讲 ..
- 江南大学 食品工艺学 51讲 主编:夏文水 国..
- 带课件习题试卷答案 动画 沈阳理工大学 电力..
- 带课件 顺德职业技术学院 制冷设备电气与控..
- 石家庄铁路职业技术学院 主编:战启芳 智能..
- 带课件 无锡职业技术学院 智能楼宇弱电设备..
本类下载排行
- 启航 宏观经济学(高鸿业)视..
- 北京交通大学 财务会计视频教..
- PKPM钢结构STS 35讲 视频教程..
- 机械工业 建筑资料员 10讲 视..
- 人大 基础会计学视频教程
- 西门子S7-300/400PLC 十章 视..
- 东北财经 基础会计视频教程
- 华中科大 液压与气压传动 26..
- 中南大学 混凝土结构设计原理..
- 启航 微观经济学(高鸿业)视..
- PKPM JCCAD 结构设计软件演示..
- 清华大学 发电机变压器继电保..
- 人大 财务管理学视频教程
- 英语词汇视频教程
- 中南大学 土力学视频教程
- 四川大学 发电厂变电所二次接..
- 实用日语语法视频教程
- 德语-标准德语语音及常用单词..
- 北京科技大学 电工电子学视频..
- 复旦大学 数据结构C++版视..
《2025 大课 付费版 深度强化学习理论与实践 33讲 视频教程》
| 这门课程价格:20元 |
★★★标题写带课件,这种是pdf课件,可免费用ai转PPT,转完后可以编辑,精准度很高 ★★★课程标题带ppt的,这是原始ppt ,可以直接编辑 ★★★什么都不标的,就是纯视频,学校没给课件
-->-->-->★如果网站里没有您要的课程,加微信可以单独给您找 |
| 课程大小:7.80G | |
| 课程格式:手机平板电脑都可以播放 | |
| 社长微信:83162582 (加微75折) | |
| 客服微信:125212385 (加微75折) | |
| ★★★18年淘宝双皇冠99.9%好评店:http://shop57589855.taobao.com/★淘宝客服: |
|
- ★★★本站新加技能:所有视频里面有课件的,都可以单独提取出来ppt或pdf或word
- ★★★有各种加密的在线视频,也可以破解提取出来mp4
- ★★★视频来源可以是b站,小红书 ,微信公众号等等,有提取业务加微信83162582
视频介绍 [复制本页地址介绍给朋友~]
第1.1节 强化学习简介
20分15秒
2
第1.2节 强化学习的模型
1小时21分
3
第1.3节 Gym介绍
44分12秒
4
第2.1节 动态规划
13分58秒
5
第2.2节 值函数和贝尔曼方程
47分51秒
6
第2.3节 策略评估
41分45秒
7
第2.4节 策略改进
44分6秒
8
第2.5节 最优值函数与最优策略
26分51秒
9
第2.6节 值迭代与策略迭代
23分24秒
10
第2.7节 动态规划求解强化学习案例
24分50秒
11
第3.1节 蒙特卡洛法简介
13分58秒
12
第3.2节 蒙特卡洛策略评估
1小时21分
13
第3.3节 蒙特卡洛强化学习
41分50秒
14
第3.4节 异策略蒙特卡洛搜索
1小时13分
15
第4.1节 时序差分策略评估
1小时21分
16
第4.2节 同策略时序差分强化学习
41分40秒
17
第4.3节 异策略时序差分强化学习
32分9秒
18
第4.4节 n步时序差分强化学习
17分24秒
19
第5.1节 从感知机到神经网络
29分6秒
20
第5.2节 深度神经网络
54分56秒
21
第5.3节 激活函数、损失函数和数据预处理
1小时24分
22
第5.4节 Pytorch深度学习
1小时43分
23
第6.1节 线性值函数近似
1小时22分
24
第6.2节 神经网络值函数近似法
1小时2分
25
第6.3节 Double DQN(DDQN)算法
11分27秒
26
第6.4节 Prioritized Repley DQN
23分2秒
27
第6.5节 Dueling DQN算法
16分23秒
28
第7.1节 策略梯度法的基本原理
1小时2分
29
第7.2节 策略梯度定理
27分22秒
30
第7.3节 蒙特卡洛策略梯度法
54分28秒
31
第8.1节 异步优势演员评论员算法
42分12秒
32
第8.2节 深度确定性策略梯度法
32分49秒
33
第8.3节 近端策略优化算法
1小时
您可能还需要如下课程
- 2026 带ppt 检测实验室管理 深信职大 126讲 视频教程 ..
- 2026 纯ppt 设计文案与表达 无锡职大讲 视频教程 手机..
- 2026 带ppt 广告策划与文案 广轻职大 72讲 视频教程 手..
- 2026 ai课件 品牌包装设计 上工美职 56讲 视频教程 手..
- 2026 带ppt 品牌策略与设计应用 福州职 273讲 视频教程..
- 2026 带ppt 品牌策划与推广 山东商职 159讲 视频教程 ..
- 2026 带ppt 商务文案策划与撰写 山科职 212讲 视频教程..
- 2026 带ppt 广告文案策划与写作 重电讯职 36讲 视频教..
- 2026 带ppt 临床实验室管理 汉中职 49讲 视频教程 手..
- 2026 带ppt 检测实验室管理与运行 漯食职 12讲 视频教..
