机读格式显示(MARC)

000 01780nam0 2200325 450

001 0000302918

005 20240327170506.5

010 __ |a 978-7-115-63395-8 |d CNY139.80

100 __ |a 20240327d2024 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a 智能控制与强化学习 |A zhi neng kong zhi yu qiang hua xue xi |e 先进值迭代评判设计 |d = Intelligent control and reinforcement learning |e advanced value iteration critic design |f 王鼎 ... [等] 著 |z eng

210 __ |a 北京 |c 人民邮电出版社 |d 2024.3

215 __ |a 236页 |c 图 |d 23cm

304 __ |a 题名页题: 王鼎, 赵明明, 哈明鸣, 任进著

320 __ |a 有书目

330 __ |a 本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题, 以实现稳定学习、演化学习和快速学习为目标, 建立一套先进的值迭代评判学习控制理论与设计方法。首先, 对先进值迭代框架下迭代策略的稳定性进行全面深入的分析, 建立一系列适用于不同场景的稳定性判据, 从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次, 基于迭代历史信息, 提出一种新颖的收敛速度可调节的值迭代算法, 有助于加快学习速度、减少计算代价, 更高效地获得非线性系统的最优控制律。结合人工智能技术, 对无模型值迭代评判学习控制的发展前景也进行了讨论。

333 __ |a 本书既可作为智能控制、强化学习、优化控制、计算智能、自适应与学习系统等领域研究人员和学生的参考书, 又可供相关领域的技术人员使用

510 1_ |a Intelligent control and reinforcement learning |e advanced value iteration critic design |z eng

517 1_ |a 先进值迭代评判设计 |A xian jin zhi die dai ping pan she ji

606 0_ |a 智能控制 |A zhi neng kong zhi

606 0_ |a 机器学习 |A ji qi xue xi

690 __ |a TP273 |v 5

690 __ |a TP181 |v 5

701 _0 |a 王鼎 |A wang ding |4 著

701 _0 |a 赵明明 |A zhao ming ming |4 著

701 _0 |a 哈明鸣 |A ha ming ming |4 著

801 _0 |a CN |b 湖北三新 |c 20240327