面向移動目標跟蹤的多星協(xié)同規(guī)劃與自主調度研究
定 價:79 元
叢書名:航天資源規(guī)劃與調度
移動目標跟蹤在軍民領域有著顯著的現(xiàn)實應用價值,而成像衛(wèi)星是實現(xiàn)移動目標跟蹤的重 要平臺之一。本書創(chuàng)造性地提出面向移動目標跟蹤的多星協(xié)同規(guī)劃與自主調度框架、模型及方法。
本書的特色是平實易懂地為讀者介紹面向移動目標跟蹤的成像衛(wèi)星任務規(guī)劃問題及方法,面向的讀者群體主要包括:運籌學相關方向的本科生和研究生、高校相關專業(yè)的教師、相關科研機構的研究人員、工業(yè)部門相關領域的技術人員、對該問題感興趣的所有讀者。
移動目標跟蹤在打擊海盜犯罪、緝拿毒品走私、空間武器預警以及海上災難救援等軍民領域都有著廣泛的應用場景與顯著的實際價值。天基遙感衛(wèi)星作為主要的空間信息采集平臺,具有覆蓋范圍廣、運行時間長以及不受國界限制等特點。這些特點賦予了天基遙感衛(wèi)星在跟蹤移動目標方面獨有的優(yōu)勢,但目標運動多變性、圖像識別概率性、目標到達隨機性等諸多不確定性因素也給天基遙感衛(wèi)星跟蹤移動目標帶來了挑戰(zhàn)。新一代敏捷衛(wèi)星具備靈活的三軸姿態(tài)機動能力,擴展了對目標的觀測窗口;傳統(tǒng)的地面規(guī)劃 星上執(zhí)行管控模式對移動目標響應嚴重滯后,星上計算能力的增強以及人工智能(artifical intelligence,AI)技術的發(fā)展為星上自主智能提供了前提,帶來解決滯后短板的契機。同時,敏捷機動以及自主智能也給當前的衛(wèi)星任務規(guī)劃系統(tǒng)帶來新的問題:敏捷能力帶來了時間依賴特征的約束,使得衛(wèi)星規(guī)劃調度變得更為復雜;移動目標具有動態(tài)不確定性,需要更合理的任務管理與任務決策機制;對移動目標的及時響應依賴于快速、高質量以及精細化的自主任務調度;多移動目標的跟蹤需要高效的星間協(xié)同。鑒于此,本書圍繞關注的海洋低速移動目標(非時敏移動目標)與空間高速移動目標(時敏移動目標)兩類目標,介紹面向移動目標跟蹤的多星協(xié)同規(guī)劃與自主調度框架、模型以及方法,其主要研究內容包含以下五個方面。1)提出多星協(xié)同規(guī)劃與自主調度的分層式通用求解框架移動目標動態(tài)不確定性使得對其跟蹤明顯區(qū)別于對靜止目標的觀測,并且資源存在一定的共用性,星座資源不可能僅服務于單一類型目標,通用求解框架的設計需要兼顧多類型移動目標和對靜止目標的觀測。此外,由于衛(wèi)星能力差異以及通信鏈路差異,還需要考慮多種協(xié)同架構的兼容性;谏鲜鰞牲c,本書提出一種分層式、模塊化的多星協(xié)同規(guī)劃與自主調度通用求解框架,該框架包括星上自主任務管理層、星間自主任務協(xié)同層以及星上自主任務調度層,支持不同資源協(xié)同方式下的模塊組合與順序搭配;谠摽蚣,針對非時敏移動目標設計集中---分布式協(xié)同架構;針對時敏移動目標設計具有互斥目標池的分散式協(xié)同架構,引入互斥目標池,降低通信代價。在不同的協(xié)同架構下,實現(xiàn)對多星協(xié)同規(guī)劃與自主調度問題的分解與解耦。2)設計通用求解框架下的星上自主任務管理模塊星上自主任務管理是通用求解框架中的重要模塊之一,主要分為目標運動預測、自主任務生成以及優(yōu)先級統(tǒng)籌,負責將目標的不確定性轉化為定量化屬性描述的任務,這依賴于目標運動建模與資源領域知識構建兩者間的關聯(lián)關系。對于非時敏移動目標,在集中---分布式協(xié)同架構下,采用基于高斯分布的雙約束預測模型實現(xiàn)運動預測,構建任務生成決策樹實現(xiàn)對任務的生成,設計多層級任務優(yōu)先級統(tǒng)籌實現(xiàn)對生成任務的優(yōu)先級配置;對于時敏移動目標,在分散式協(xié)同架構下,結合橢圓軌道與龍格-庫塔積分方法進行軌跡預測,引入動態(tài)優(yōu)先級實現(xiàn)對目標的動態(tài)屬性配置。 3)提出一種基于圖注意力網(wǎng)絡與近端策略優(yōu)化的深度強化學習求解面向非時敏移動目標跟蹤的單星自主任務調度問題在集中分布式協(xié)同架構下,研究面向非時敏移動目標的單星自主任務調度問題。在建模過程中,引入時姿鄰接圖模型對問題進行描述。借鑒動態(tài)規(guī)劃與序列解構造思想,將問題的約束模型轉化為馬爾可夫決策過程模型。在問題求解中,采用圖注意力網(wǎng)絡對問題進行特征提取,并基于近端策略優(yōu)化的深度強化學習對網(wǎng)絡進行訓練。仿真結果表明,該算法不但在求解質量上大幅超越了啟發(fā)式、經(jīng)典的元啟發(fā)式以及深度Q學習算法,而且求解速度很快,在典型場景下能夠實現(xiàn)近實時的求解。4)提出一種基于基因表達式編程的演化構造啟發(fā)式求解面向非時敏移動目標跟蹤的多星協(xié)同任務分配問題在集中---分布式協(xié)同架構下,研究面向非時敏移動目標跟蹤的多星協(xié)同任務分配問題,旨在通過快速的任務分配,將星上自主任務管理模塊生成的任務分配給各衛(wèi)星,實現(xiàn)多星協(xié)同任務規(guī)劃的收益最大化。在建模過程中,對問題進行描述并建立整數(shù)規(guī)劃模型?紤]求解的時效性,提出一種基于基因表達式編程的演化構造啟發(fā)式方法,借鑒序列解構造思想,在序列化決策過程中采用演化規(guī)則求解該問題。首先基于領域知識提取該問題的16個特征,然后采用基因表達式編程對問題求解規(guī)則進行演化。仿真結果顯示,該演化規(guī)則全面超越了引入自適應機制的三類啟發(fā)式規(guī)則,并取得了接近元啟發(fā)式算法的求解效果,求解速度同樣很快。5)提出一種基于知識規(guī)則的分散式多星自主協(xié)同任務規(guī)劃方法求解面向時敏移動目標跟蹤的多星自主協(xié)同任務規(guī)劃問題相比非時敏移動目標的跟蹤,面向時敏移動目標的多星自主協(xié)同任務規(guī)劃問題依賴于更短的決策周期,通過星上快速決策、調度與協(xié)同實現(xiàn)對目標不確定性的及時響應。本書在分析時敏移動目標獨有特性的基礎上,對具有互斥目標池的分散式協(xié)同架構進行具體設計;采用馬爾可夫決策過程實現(xiàn)單星自主任務調度的建模,并基于分散式馬爾可夫決策過程實現(xiàn)對多星協(xié)同任務規(guī)劃的建模;同時針對問題求解的難度進行了分析,并在此基礎上,采用基于知識規(guī)則的方法實現(xiàn)包括目標決策、候選子任務生成以及候選子任務選擇的單星自主任務調度求解。然后,對星間在線協(xié)同設計了基于需求---響應的任務規(guī)劃沖突消解機制來提升系統(tǒng)的整體效益。該方法能夠有效求解面向時敏移動目標的多星自主協(xié)同任務規(guī)劃問題,具備星上部署的實用性。20172024年,作者始終致力于衛(wèi)星任務規(guī)劃及優(yōu)化調度方面的研究,本書凝結了這期間積累的主要研究成果。在內容研究及書稿撰寫期間,賀仁杰導師、劉曉路老師給予了作者悉心的指導,課題組的老師、同窗、師兄弟及秘書等提供了很多幫助,項目合作伙伴也提供了不少技術支持。當然,書籍的成稿出版,也離不開清華大學出版社陳凱仁編輯的辛勤付出。在此,作者由衷感謝為本書研究、撰稿以及出版提供了支持和幫助的各位老師、同門以及專家學者!本書圍繞時敏與非時敏兩類移動目標的跟蹤,對多星協(xié)同規(guī)劃與自主調度的框架、模型及方法等進行了初步研究。研究的問題背景源于工程應用,涉及衛(wèi)星任務規(guī)劃、組合優(yōu)化、運籌學、不確定性調度等多方面的學科交叉點,研究成果可為相關領域的理論研究和工程應用提供有價值的借鑒與參考。當然,本書介紹的研究工作仍有待進一步拓展。作者撰寫本書不僅是為與相關領域工作者分享所悟,更是期待通過本書激發(fā)廣大讀者對相關科學問題的興趣,共同加入未知但可期的求知探索中。盡管作者已竭盡全力提高本書的內容與質量,但是受限于個人水平,書中不可避免會出現(xiàn)疏漏之處,懇請各位讀者不吝賜教,對書中不當之處,敬請批評指正!
作者2024年11月于北京
楊文沅,國防科技大學助理研究員,獲得國防科技大學管理科學與工程專業(yè)博士學位。主要研究方向為系統(tǒng)規(guī)劃與管理決策技術、智能任務規(guī)劃與調度、無人集群智能協(xié)同,長期從事對地觀測衛(wèi)星任務規(guī)劃與調度相關工作。作為骨干成員參與國家、軍隊以及省部級等各類項目10余項,目前在國內外重要刊物和會議上發(fā)表學術論文10余篇,申請和授權國家發(fā)明專利9項。
第1章 緒論 11.1 研究背景與意義 11.1.1 研究背景 11.1.2 研究意義 51.2 國內外研究現(xiàn)狀與總結 61.2.1 移動目標運動預測問題研究現(xiàn)狀 61.2.2 敏捷能力下的單星自主調度問題研究現(xiàn)狀 91.2.3 多星自主協(xié)同規(guī)劃問題研究現(xiàn)狀 141.2.4 機器學習方法在組合優(yōu)化問題中應用現(xiàn)狀 171.2.5 現(xiàn)狀分析與總結 191.3 本書主要工作 201.3.1 研究內容 201.3.2 組織結構 221.3.3 創(chuàng)新點 24第2章 問題描述與求解框架 262.1 目標資源分析 262.1.1 移動目標特征與分類 262.1.2 天基遙感衛(wèi)星資源特征與分類 282.1.3 面向移動目標跟蹤的星座資源 292.2 面向移動目標跟蹤的多星協(xié)同規(guī)劃與自主調度問題 332.2.1 問題約束特征 342.2.2 問題優(yōu)化目標 402.2.3 問題分析總結 412.3 多星協(xié)同規(guī)劃與自主調度問題通用求解框架 412.3.1 多星協(xié)同規(guī)劃與自主調度的分層式通用求解框架 422.3.2 通用求解架構下的多星協(xié)同規(guī)劃與自主調度問題分解 432.4 本章小結 48第3章 面向移動目標跟蹤的星上自主任務管理 493.1 移動目標運動模型與預測方法 493.1.1 非時敏移動目標運動模型與預測方法 493.1.2 時敏移動目標運動模型與預測方法 613.2 面向移動目標的星上自主任務生成 653.2.1 任務生成時間決策 663.2.2 任務生成要素決策 683.3 面向移動目標的任務優(yōu)先級統(tǒng)籌 693.3.1 面向非時敏移動目標的任務優(yōu)先級統(tǒng)籌 693.3.2 面向時敏移動目標的目標優(yōu)先級統(tǒng)籌 723.4 本章小結 74第4章 面向非時敏移動目標跟蹤的單星自主任務調度技術 754.1 問題描述與建模 764.1.1 問題假設 764.1.2 符號說明 774.1.3 問題模型 774.1.4 敏捷姿態(tài)機動能力下時間依賴轉換時間約束處理 814.2 基于圖注意力網(wǎng)絡的問題特征提取 834.2.1 圖注意力網(wǎng)絡 834.2.2 單星自主任務調度問題特征提取 844.2.3 單星自主任務調度問題的圖注意力網(wǎng)絡結構 884.3 基于近端策略優(yōu)化的深度強化學習的問題求解 904.3.1 問題求解框架 914.3.2 強化學習中的基本概念 924.3.3 基于GAT的問題求解 934.3.4 基于PPO的網(wǎng)絡模型訓練 934.4 仿真實驗及分析 964.4.1 仿真實驗設計 964.4.2 訓練過程分析 994.4.3 算法可行性分析 1004.4.4 算法效能分析 1024.5 本章小結 109第5章 面向非時敏移動目標跟蹤的多星協(xié)同任務分配技術 1115.1 問題描述與建模 1125.1.1 多星協(xié)同任務分配問題 1125.1.2 問題假設 1135.1.3 符號說明 1145.1.4 問題模型 1145.1.5 問題復雜性分析與求解思路 1155.2 基于自適應機制的啟發(fā)式多星協(xié)同任務分配方法 1165.3 基于基因表達式編程演化構造啟發(fā)式多星協(xié)同任務分配方法 1215.3.1 問題求解框架 1225.3.2 問題特征選取與歸一化 1225.3.3 基于GEP的規(guī)則演化方法 1275.4 仿真實驗及分析 1355.4.1 仿真實驗設計 1355.4.2 演化過程分析 1355.4.3 算法可行性分析 1395.4.4 算法效能分析 1405.5 本章小結 145第6章 面向時敏移動目標跟蹤的多星自主協(xié)同規(guī)劃技術 1476.1 問題描述與建模 1486.1.1 多星協(xié)同任務規(guī)劃問題 1486.1.2 問題假設 1526.1.3 符號說明 1536.1.4 問題模型 1546.2 分散式多星自主協(xié)同任務規(guī)劃方法 1586.2.1 問題求解分析 1596.2.2 面向時敏移動目標的星上自主任務管理 1596.2.3 基于知識規(guī)則的單星自主調度方法 1606.2.4 基于RRB的多星在線協(xié)同機制 1646.3 仿真實驗及分析 1676.3.1 仿真實驗設計 1676.3.2 算法可行性分析 1686.3.3 算法參數(shù)分析 1746.3.4 候選子任務選擇策略分析 1766.4 本章小結 177第7章 結論與展望 1787.1 結論 1787.2 展望 180參考文獻 183附錄A 縮略語表 194