ISBN/价格: | 978-7-118-13179-6:CNY89.00 |
---|---|
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | 深度强化学习/.(印度)莫希特·塞瓦克(Mohit Sewak)著/.尹大伟,吴敏杰译 |
出版发行项: | 北京:,国防工业出版社:,2024 |
载体形态项: | 165页:;+图:;+25cm |
一般附注: | 装备科技译著出版基金 |
提要文摘: | 本书从强化学习的基本模块开始,涵盖了流行的经典动态规划(DP)方法和经典强化学习方法,如价值(Value)迭代和策略(Policy)迭代;同时也包括一些传统的强化学习算法,如时序差分(TD)学习、SARSA和Q学习。在此基础之上,介绍了适用于现代强化学习环境和智能体的深度学习和辅助工具。 |
并列题名: | Deep reinforcement learning eng |
题名主题: | 机器学习 |
中图分类: | TP181 |
个人名称等同: | 塞瓦克 (印) (Sewak, Mohit) 著 |
个人名称次要: | 尹大伟 译 |
个人名称次要: | 吴敏杰 译 |
记录来源: | CN 世纪蓝图 20241224 |