吉林大學朱冰獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網獲悉吉林大學申請的專利基于大模型知識引導的智能汽車關鍵場景優(yōu)化生成方法獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN120144481B 。
龍圖騰網通過國家知識產權局官網在2025-08-19發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202510622702.1,技術領域涉及:G06F11/3668;該發(fā)明授權基于大模型知識引導的智能汽車關鍵場景優(yōu)化生成方法是由朱冰;湯瑞;趙健;張培興;黃殷梓;李文旭;曹昕然;王帥;張錫智設計研發(fā)完成,并于2025-05-15向國家知識產權局提交的專利申請。
本基于大模型知識引導的智能汽車關鍵場景優(yōu)化生成方法在說明書摘要公布了:本發(fā)明屬于自動駕駛汽車測試技術領域,具體的說是基于大模型知識引導的智能汽車關鍵場景優(yōu)化生成方法。包括:S1、構建知識表達模塊,從場景理論知識和場景探索知識兩部分設計知識結果、大語言模型應用方式和動態(tài)更新過程;S2、構建參數(shù)優(yōu)化模塊,設計包含全局探索、局部尋優(yōu)和空間剪枝多階段尋優(yōu)策略,與知識模型相融合;S3、搭建仿真測試模塊,基于Carla仿真平臺,通過LLM?Agent構建場景搭建、待測系統(tǒng)、仿真執(zhí)行、數(shù)據(jù)導出組件;S4、選型預訓練大語言模型,設計選型指標并進行模型選取;S5、構建評價和記憶模塊,對測試結果進行評價,存儲所有測試和知識數(shù)據(jù)。本發(fā)明通過知識模型、大語言模型與優(yōu)化搜索的互相結合,可以迅速生成智能汽車的關鍵場景。
本發(fā)明授權基于大模型知識引導的智能汽車關鍵場景優(yōu)化生成方法在權利要求書中公布了:1.一種基于大模型知識引導的智能汽車關鍵場景優(yōu)化生成方法,其特征在于,包括以下步驟: S1、構建知識表達模塊,從場景理論知識和場景探索知識兩部分設計知識結果、大語言模型應用方式和動態(tài)更新過程; S2、構建參數(shù)優(yōu)化模塊,設計包含全局探索、局部尋優(yōu)和空間剪枝多階段尋優(yōu)策略,與知識模型相融合; S3、搭建仿真測試模塊,基于Carla仿真平臺,通過LLM-Agent構建場景搭建、待測系統(tǒng)、仿真執(zhí)行、數(shù)據(jù)導出組件; S4、選型預訓練大語言模型,設計選型指標并進行模型選取; S5、構建評價和記憶模塊,對測試結果進行評價,并存儲過程中的所有測試和知識數(shù)據(jù); 其中,所述S1的具體方法如下: S11、建立場景理論知識,包含重要性、單調性和耦合性三部分; S111、建立重要性; 針對確定的自動駕駛系統(tǒng),通過互相比較獲取具體場景要素的重要性,從而構建要素重要性模型,具體為: S1111、LLM解析待測系統(tǒng)功能需求,通過自然語言推理生成要素兩兩比較語義描述,轉換為判斷矩陣; S1112、基于層次分析檢驗Agent進行判斷,如果一致性比率即CR檢驗通過,則表明結果可用,保存到知識庫中,供后續(xù)優(yōu)化搜索使用,否則沿用之前的數(shù)值,CR的計算方法如下: 式中,RI為隨機一致性指標,當CR小于0.1,認為矩陣具有滿意的一致性;通過將AHP與LLM結合,自動生成并更新場景要素的重要性模型,量化各要素的影響,同時LLM根據(jù)后續(xù)優(yōu)化過程中的參數(shù)靈敏度數(shù)據(jù),動態(tài)調整判斷矩陣元素值,形成閉環(huán)修正系統(tǒng); S112、建立單調性; 通過LLM基于運動學方程和物理規(guī)律分析得出,用于指導測試邊界的搜索過程,具體為: S1121、LLM基于物理運動學理論,初步判斷場景要素的單調性等級; S1122、構建局部靈敏度分析方法即SA,根據(jù)離散差分近似計算偏導數(shù): 測試數(shù)據(jù)與靈敏度分析結果再次提供給LLM,LLM基于測試數(shù)據(jù)生成修正后的單調性映射表; S113、建立耦合性; 通過系統(tǒng)工程中的耦合度理論分析要素間的相互依賴關系,由LLM完成,具體為: S1131、利用LLM對測試場景的理解能力,基于歷史數(shù)據(jù),建立要素間的耦合關系,對耦合性強度進行標注,以耦合度矩陣M表達,其中每個元素mij表示要素i與j間的耦合強度; S1132、在測試過程的每個階段,利用相關性分析即CA計算各要素間的斯皮爾曼相關系數(shù)rs,量化要素間的非線性關聯(lián),提供給LLM,輔助LLM調整耦合關系進行,計算公式如下: 式中,di為兩組排序數(shù)據(jù)之間的差異,x為樣本數(shù)量;根據(jù)rs的值調整耦合度矩陣中的相應位置,以反映最新的非線性相關關系; S12、建立場景探索知識,包含空間區(qū)域特征、優(yōu)解特征和收斂特征三部分; S121、對空間區(qū)域特征進行分析;將搜索空間分為未發(fā)掘部分和已發(fā)掘部分,具體為: S1211、LLM識別搜索過程中的空白區(qū)域,同時與后續(xù)的場景空間分區(qū)策略相結合,優(yōu)化全局探索效率;在d維測試空間中,每個點Pi用向量xi1,xi2,...,xid表示,其中i=1,2,...,N,對于每個維度j∈{1,2,...,d},定義任意點到最近前向遞推已知點的距離如下: 式中,Kj為確定為已經發(fā)掘區(qū)域內的點集在第j維度上的投影,設定閾值Rj,如果計算的距離結果小于Rj,則認為已經發(fā)掘;動態(tài)調整,LLM基于歷史數(shù)據(jù)和理論模型自動識別和更新區(qū)域特征,從而實現(xiàn)加速測試過程中區(qū)域特征的動態(tài)更新; S122、對優(yōu)解特征進行分析; 記錄在優(yōu)化過程中發(fā)現(xiàn)的關鍵場景要素的最優(yōu)解信息;通過實時跟蹤和分析各個要素區(qū)域的表現(xiàn),保存全局最優(yōu)解,當找到新的全局最優(yōu)解gbi時,將全局最優(yōu)解gbi加入集合中,設定最大容量Smax,當超過最大容量時,移除最早進入的元素; 同時,通過提示詞設計,LLM推斷出當前維度下的推薦取值,從而構建和動態(tài)更新優(yōu)質解集合,利用LLM對知識的理解能力指導后續(xù)局部尋優(yōu)過程;對優(yōu)質解集合中的相應維度進行統(tǒng)計分析,獲取均值和標準差: 計算結果用以輔助LLM的取值推薦過程; S123、評估優(yōu)化搜索過程的效果,具體為: 所述S123的具體方法如下: S1231、LLM根據(jù)每次優(yōu)化搜索過程中的關鍵場景數(shù)目以及粒子種群的收斂性判據(jù),分析局部優(yōu)化階段是否能夠持續(xù)發(fā)掘測試場景,或是否需要轉入全局探索階段; S1232、收斂性分析包括對優(yōu)化算法的收斂速度Vt、穩(wěn)定性σt和重復特征Dt進行量化評估,并根據(jù)評估結果調整優(yōu)化策略,以保證搜索過程的全面性,為了輔助LLM分析,構建各指標計算公式如下: 式中,F(xiàn)t+1為第t次迭代找到的關鍵場景數(shù)目;F0為初始粒子空間中的關鍵場景數(shù)目;為第t代所有粒子位置的平均值;d為粒子間的歐幾里得距離; S13、設計知識構建與動態(tài)更新流程; 通過預設的提示詞模板引導LLM生成上下文提示,以此動態(tài)更新知識表達模型,從而指導后續(xù)的決策和行動; S131、設計測試初始階段,具體為: 測試初始階段,基于測試場景相關理論和待測系統(tǒng)信息,構建初步的場景理論模型;將場景描述轉換為提示詞,并結合上下文信息,輔助LLM初始化構建理論知識模型; S132、設計優(yōu)化過程,具體為: 在優(yōu)化過程中,收集優(yōu)化搜索過程的歷史指令、種群變量狀態(tài)、場景庫數(shù)據(jù)及仿真測試結果,基于預設的涵蓋優(yōu)化搜索的關鍵概念、目標函數(shù)以及場景理論相關的提示詞模板形成上下文信息;LLM基于當前上下文信息,調用對應的Agent計算工具,生成關于場景要素的重要性、單調性、耦合性知識,并據(jù)此動態(tài)更新場景理論知識;對于探索過程知識,記錄區(qū)域特征、優(yōu)解特征和收斂特征,并對LLM優(yōu)解進行推斷,保存為具體數(shù)值矩陣; S133、進行動態(tài)更新,具體為: 在每輪優(yōu)化后,LLM不斷接收新數(shù)據(jù),通過SA、CA和AHPagent的協(xié)同工作,實現(xiàn)知識檢驗與靈敏度、相關性數(shù)據(jù)生成,輔助LLM學習并適應測試環(huán)境變化,調整知識表達模型;更新后的知識表達將指導后續(xù)參數(shù)優(yōu)化模塊中的智能體決策行為,決策結果再次反饋至系統(tǒng),形成持續(xù)改進的閉環(huán); 所述S2的具體方法如下: S21、對全局探索部分進行建模,具體為: S211、對于每個場景維度,判斷每個維度的重要性及取值區(qū)間是否發(fā)生變化;如果是初次生成或者發(fā)生變化的維度,按照場景參數(shù)的具體取值、離散步長和重要性進行重新分區(qū);如果沒有發(fā)生變化,則無需再次分區(qū); S212、在每個單維度分區(qū)內隨機選擇數(shù)據(jù)點,并組合生成采樣空間; S213、在采樣空間中采用隨機采樣方法選擇所需樣本; 所述S22的具體方法如下: S221、區(qū)域聚合; 首先利用區(qū)域特征、優(yōu)解特征對全局探索模塊劃分的區(qū)域進行聚合,對各場景參數(shù)在各自劃分區(qū)域內進行統(tǒng)計分析,從取值起點出發(fā),將關鍵場景數(shù)量大于20%整體空間內關鍵場景數(shù)量的區(qū)域標記為核心區(qū)域;圍繞核心區(qū)域中心定義分隔帶,核心區(qū)域聚合后長度不超過該場景參數(shù)最小區(qū)域長度的3倍,對于非核心區(qū)域,以不超過最小區(qū)域5倍的長度進行聚合,長度大于核心區(qū)域; S222、粒子方程優(yōu)化; 構建與重要性知識結果等值的重要性權值;LLM通過提示詞給出推薦探索的最優(yōu)解,引導粒子運動設計如下粒子運動方程: 式中,為時間步t時粒子i在第d個參數(shù)維度上的速度;ω為慣性權重;Id為第d個參數(shù)維度的重要性權值;c1為所在區(qū)域加速常數(shù);c2為其他區(qū)域加速常數(shù),所在區(qū)域和其他區(qū)域即為區(qū)域聚合后粒子所在的區(qū)域,綜合多種區(qū)域有助于粒子快速收斂和掌握全局視野;c3為全局加速常數(shù);c4為LLM加速常數(shù);r1,r2,r3,r4為[0,1]之間的隨機數(shù),用于增加搜索的隨機性;為當前粒子i在第d個參數(shù)維度上的位置;為當前粒子第d個參數(shù)維度在所在區(qū)域內的最優(yōu)位置;為除粒子第d個參數(shù)維度所在區(qū)域外其他所有區(qū)域最優(yōu)解的和;nd為粒子第d個參數(shù)維度上的聚合區(qū)域數(shù)目;為LLM分析給出的粒子第d個參數(shù)維度的最優(yōu)解;為t+1時間步時的粒子位置;為計算得出的t+1時間步時的粒子速度; 所述S23的具體方法如下: S231、約束單調性; 對于已知具有單調性的參數(shù),建立約束條件,排除根據(jù)單調性判斷不可能包含更優(yōu)解的區(qū)域; S232、分析耦合性; 針對參數(shù)間的耦合性,構建參數(shù)之間的相關性模型,利用模型判斷無效的參數(shù)組合;在搜索過程中,當遇到某組參數(shù)值時,依據(jù)耦合性分析結果,剪掉在給定參數(shù)值下不可能產生更好解的參數(shù)空間區(qū)域; S233、設計剪枝緩沖帶; 關鍵性最高的要素初始緩沖帶最高,為要素在全局探索部分的區(qū)域寬度,其他要素緩沖帶根據(jù)重要性等比例換算,每開始執(zhí)行一次空間剪枝部分,將緩沖帶寬度調整為上一輪的34; 所述S24的具體方法如下: 全局探索、局部尋優(yōu)和空間剪枝三個模塊的協(xié)同作用完成循環(huán)優(yōu)化過程;全局探索部分在測試開始時以及優(yōu)化陷入局部最優(yōu)時調用,補充粒子群中的多樣個體;局部尋優(yōu)部分在每一輪尋優(yōu)后判斷是否循環(huán)輪數(shù)結束;每一輪尋優(yōu)后判斷是否循環(huán)輪數(shù)結束,如果沒有結束則根據(jù)空間剪枝部分刪減參數(shù)空間,排除非關鍵區(qū)域;進一步集成收斂性知識,如果收斂則轉入全局探索部分生成新一輪探索結果,否則繼續(xù)執(zhí)行局部尋優(yōu)部分;將語句邏輯轉換為任務提示詞,輔助LLM進行Agent調度和優(yōu)化工作; S22、對局部尋優(yōu)部分進行建模; S23、對空間剪枝部分進行建模; S24、設計優(yōu)化執(zhí)行過程。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人吉林大學,其通訊地址為:130012 吉林省長春市朝陽區(qū)前進大街2699號;或者聯(lián)系龍圖騰網官方客服,聯(lián)系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。