幫助中心 | 我的帳號 | 關於我們

智能控制與強化學習(先進值迭代評判設計)

  • 作者:王鼎//趙明明//哈明鳴//任進|責編:哈爽
  • 出版社:人民郵電
  • ISBN:9787115633958
  • 出版日期:2024/03/01
  • 裝幀:平裝
  • 頁數:236
人民幣:RMB 139.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    在人工智慧技術的大力驅動下,智能控制與強化學習發展迅猛,先進自動化設計與控制日新月異。本書針對複雜離散時間系統的優化調節、最優跟蹤、零和博弈等問題,以實現穩定學習、演化學習和快速學習為目標,建立一套先進的值迭代評判學習控制理論與設計方法。首先,對先進值迭代框架下迭代策略的穩定性進行全面深入的分析,建立一系列適用於不同場景的穩定性判據,從理論層面揭示值迭代演算法能夠實現離線最優控制和在線演化控制。其次,基於迭代歷史信息,提出一種新穎的收斂速度可調節的值迭代演算法,有助於加快學習速度、減少計算代價,更高效地獲得非線性系統的最優控制律。結合人工智慧技術,對無模型值迭代評判學習控制的發展前景也進行了討論。
    本書內容豐富、結構清晰、由淺入深、分析透徹,既可作為智能控制、強化學習、優化控制、計算智能、自適應與學習系統等領域研究人員和學生的參考書,又可供相關領域的技術人員使用。

作者介紹
王鼎//趙明明//哈明鳴//任進|責編:哈爽

目錄
第1章  智能評判控制的先進值迭代方法概述
  1.1  引言
  1.2  面向最優調節的值迭代演算法
    1.2.1  離散時間HJB方程
    1.2.2  傳統值迭代演算法
    1.2.3  廣義值迭代演算法
    1.2.4  集成值迭代演算法
    1.2.5  演化值迭代演算法
    1.2.6  可調節值迭代演算法
  1.3  面向最優跟蹤的值迭代演算法
    1.3.1  求解穩態控制的值迭代跟蹤演算法
    1.3.2  無穩態控制的值迭代跟蹤演算法
  1.4  面向零和博弈的值迭代演算法
    1.4.1  離散時間HJI方程
    1.4.2  零和博弈最優調節問題
    1.4.3  零和博弈最優跟蹤問題
  1.5  小結
  參考文獻
第2章  基於折扣廣義值迭代的線性最優調節與穩定性分析
  2.1  引言
  2.2  問題描述
  2.3  線性系統的折扣廣義值迭代演算法
    2.3.1  折扣廣義值迭代演算法推導
    2.3.2  性能分析
  2.4  模擬實驗
  2.5  小結
  參考文獻
第3章  基於折扣廣義值迭代的非線性最優控制與穩定性分析
  3.1  引言
  3.2  問題描述
  3.3  非線性系統的折扣廣義值迭代演算法
    3.3.1  折扣廣義值迭代演算法推導
    3.3.2  性能分析
  3.4  模擬實驗
  3.5  小結
  參考文獻
第4章  基於折扣廣義值迭代的非線性智能最優跟蹤
  4.1  引言
  4.2  問題描述
  4.3  面向智能最優跟蹤的廣義值迭代
    4.3.1  面向最優跟蹤的折扣廣義值迭代演算法推導
    4.3.2  面向最優跟蹤的折扣廣義值迭代演算法性質
  4.4  基於神經網路的演算法實現
  4.5  模擬實驗
  4.6  小結
  參考文獻
第5章  基於廣義值迭代的新型事件觸發最優跟蹤控制
  5.1  引言
  5.2  問題描述
  5.3  基於事件的近似最優跟蹤控制設計

    5.3.1  廣義值迭代演算法推導
    5.3.2  事件觸發最優控制設計
  5.4  基於神經網路的演算法實現
    5.4.1  模型網路
    5.4.2  評判網路
    5.4.3  執行網路
  5.5  模擬實驗
  5.6  小結
  參考文獻
第6章  具有先進評判學習結構的廣義值迭代軌跡跟蹤
  6.1  引言
  6.2  問題描述
    6.2.1  傳統代價函數的局限性
    6.2.2  基於新型代價函數的最優跟蹤控制
  6.3  基於新型代價函數的廣義值迭代演算法
    6.3.1  具有新型代價函數的廣義值迭代演算法推導
    6.3.2  具有新型代價函數的廣義值迭代演算法性質
  6.4  具有新型代價函數的迭代二次啟髮式規劃演算法
    6.4.1  迭代二次啟髮式規劃演算法推導
    6.4.2  未知系統動態辨識
    6.4.3  單一神經網路演算法實現
  6.5  模擬實驗
  6.6  小結
  參考文獻
第7章  融合集成與演化值迭代的非線性零和博弈設計
  7.1  引言
  7.2  問題描述
  7.3  面向零和博弈的廣義值迭代演算法
    7.3.1  非線性零和博棄的廣義值迭代演算法推導
    7.3.2  線性零和博棄的廣義值迭代演算法推導
    7.3.3  面向零和博弈的廣義值迭代演算法特性
  7.4  零和博弈問題的演化值迭代控制設計
  7.5  模擬實驗
  7.6  小結
  參考文獻
第8章  收斂速度可調節的新型值迭代機制
  8.1  引言
  8.2  問題描述
  8.3  新型可調節值迭代框架
    8.3.1  新型可調節值迭代演算法推導
    8.3.2  新型可調節值迭代演算法性質
    8.3.3  加速值迭代演算法的實際設計
  8.4  模擬實驗
  8.5  小結
  參考文獻
第9章  融合可調節與穩定值迭代的約束跟蹤控制
  9.1  引言
  9.2  問題描述
  9.3  面向最優跟蹤的可調節值迭代演算法
    9.3.1  約束跟蹤問題的可調節值迭代演算法推導

    9.3.2  約束跟蹤問題的可調節值迭代演算法性質
  9.4  穩定值迭代演算法及演化控制設計
    9.4.1  約束跟蹤問題的穩定值迭代演算法推導
    9.4.2  約束跟蹤問題的穩定值迭代演化控制
  9.5  模擬實驗
  9.6  小結
  參考文獻
第10章  面向非線性零和博弈的演化與增量值迭代
  10.1  引言
  10.2  問題描述
  10.3  面向零和博弈的演化值迭代演算法
    10.3.1  零和博弈問題的折扣值迭代演算法推導
    10.3.2  零和博弈問題的演化值迭代演算法特性
  10.4  面向零和博弈的增量值迭代演算法
    10.4.1  考慮歷史迭代信息的值迭代演算法
    10.4.2  零和博弈最優調節的增量值迭代演算法
    10.4.3  零和博弈最優跟蹤的增量值迭代演算法
  10.5  模擬實驗
  10.6  小結
  參考文獻
後記

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032