同濟(jì)大學(xué)孫友剛獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉同濟(jì)大學(xué)申請的專利一種磁浮列車懸浮系統(tǒng)的安全強(qiáng)化學(xué)習(xí)控制方法、設(shè)備及介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120215280B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-12發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510667687.2,技術(shù)領(lǐng)域涉及:G05B13/04;該發(fā)明授權(quán)一種磁浮列車懸浮系統(tǒng)的安全強(qiáng)化學(xué)習(xí)控制方法、設(shè)備及介質(zhì)是由孫友剛;趙小寧;吉文;徐俊起;方鷺洋設(shè)計(jì)研發(fā)完成,并于2025-05-23向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種磁浮列車懸浮系統(tǒng)的安全強(qiáng)化學(xué)習(xí)控制方法、設(shè)備及介質(zhì)在說明書摘要公布了:本發(fā)明公開了一種磁浮列車懸浮系統(tǒng)的安全強(qiáng)化學(xué)習(xí)控制方法、設(shè)備及介質(zhì),涉及磁浮控制技術(shù)領(lǐng)域,所述方法包括以下步驟:S1、構(gòu)建懸浮系統(tǒng)動力學(xué)模型,作為訓(xùn)練環(huán)境;S2、將懸浮系統(tǒng)的控制問題建模為約束尋優(yōu)問題;S3、將約束尋優(yōu)問題轉(zhuǎn)為無約束優(yōu)化問題,對目標(biāo)函數(shù)進(jìn)行迭代求解;S4、構(gòu)建代價函數(shù),加快無約束優(yōu)化問題的求解,設(shè)計(jì)懲罰項(xiàng)以引導(dǎo)系統(tǒng)狀態(tài)遠(yuǎn)離安全邊界;S5、在強(qiáng)化學(xué)習(xí)環(huán)境中,結(jié)合代價函數(shù),對無約束優(yōu)化問題進(jìn)行迭代訓(xùn)練求解。本發(fā)明不依賴于精確的懸浮系統(tǒng)模型,無需針對每個特定挑戰(zhàn)設(shè)計(jì)單獨(dú)的控制策略,可通過與懸浮系統(tǒng)的交互自適應(yīng)學(xué)習(xí)最優(yōu)控制策略,具有較強(qiáng)的魯棒性與靈活性。
本發(fā)明授權(quán)一種磁浮列車懸浮系統(tǒng)的安全強(qiáng)化學(xué)習(xí)控制方法、設(shè)備及介質(zhì)在權(quán)利要求書中公布了:1.一種磁浮列車懸浮系統(tǒng)的安全強(qiáng)化學(xué)習(xí)控制方法,其特征在于,包括以下步驟: S1、構(gòu)建考慮多種外部干擾、時滯及軌道不平順的懸浮系統(tǒng)動力學(xué)模型,作為強(qiáng)化學(xué)習(xí)算法的訓(xùn)練環(huán)境; S2、將懸浮系統(tǒng)的控制問題建模為約束尋優(yōu)問題,定義李雅普諾夫候選函數(shù)及穩(wěn)定性約束條件; S3、將S2步驟的約束尋優(yōu)問題轉(zhuǎn)為無約束優(yōu)化問題,并通過梯度下降法對目標(biāo)函數(shù)進(jìn)行迭代求解; S4、基于屏障函數(shù)構(gòu)建代價函數(shù),加快S3步驟無約束優(yōu)化問題的求解,并結(jié)合懸浮系統(tǒng)的物理邊界限制,設(shè)計(jì)懲罰項(xiàng)以引導(dǎo)系統(tǒng)狀態(tài)遠(yuǎn)離安全邊界; S5、在S1步驟建立的強(qiáng)化學(xué)習(xí)環(huán)境中,結(jié)合S4步驟的代價函數(shù),對S3步驟的無約束優(yōu)化問題進(jìn)行迭代訓(xùn)練求解,得到具有穩(wěn)定性保證與安全約束懸浮系統(tǒng)的強(qiáng)化學(xué)習(xí)智能體; 在所述S3的步驟中,所述無約束優(yōu)化問題的目標(biāo)函數(shù)為: ; 其中,和是拉格朗日乘子;是智能體在環(huán)境中接收到的觀測值;是從經(jīng)驗(yàn)回放池中采樣得到的獎勵求期望;是時刻的獎勵;是代價; 考慮保證穩(wěn)定性即可滿足最大化獎勵,上式簡化為: ; 通過梯度下降法進(jìn)行更新: ; 其中,是對求梯度;是對求梯度; 拉格朗日乘子通過最大化以下目標(biāo)更新: ; 其中,是從經(jīng)驗(yàn)回放池中獲取的期望; 并被限制為正值: ; 其中,是學(xué)習(xí)率;是對求梯度; 李雅普諾夫批評家的損失函數(shù)定義為: ; 其中,是李雅普諾夫候選函數(shù),作為更新的目標(biāo)函數(shù); 進(jìn)一步的,選取為有限時間窗口內(nèi)的代價和: ; 其中,是代價函數(shù);是時刻的系統(tǒng)狀態(tài); 在所述S4的步驟中,所述屏障函數(shù)的設(shè)計(jì)包括: 定義系統(tǒng)的安全集合和度量系統(tǒng)狀態(tài)是否在內(nèi)的函數(shù),滿足: ; ; ; 其中,是安全邊界;是維歐幾里得空間;是實(shí)數(shù)集;是度量系統(tǒng)狀態(tài); 構(gòu)造所述屏障函數(shù),其滿足當(dāng)系統(tǒng)接近安全邊界時,屏障函數(shù)值趨于無窮大,屏障函數(shù)為: ; 其中,是懸浮系統(tǒng)的安全邊界,上式可滿足屏障函數(shù)的要求: ; ; 其中,是對于任意系統(tǒng)狀態(tài); 將所述屏障函數(shù)與誤差敏感項(xiàng)結(jié)合,形成綜合所述代價函數(shù): 增加代價項(xiàng),提高平衡點(diǎn)附近的代價值設(shè)計(jì)為: ; 其中,是調(diào)整誤差敏感程度的底數(shù);,,是可調(diào)整的系數(shù); 則總的代價為: ; 其中,,,,,,,,均為可調(diào)整的系數(shù);是懸浮氣隙;是氣隙速度; 取,,,,,,,即為所構(gòu)建的代價函數(shù)。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人同濟(jì)大學(xué),其通訊地址為:200000 上海市楊浦區(qū)四平路1239號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 深圳御煙實(shí)業(yè)有限公司陳斌獲國家專利權(quán)
- 視力移動科技公司伊泰·卡茨獲國家專利權(quán)
- 谷歌有限責(zé)任公司連寄楣獲國家專利權(quán)
- 康普技術(shù)有限責(zé)任公司楊崇麗獲國家專利權(quán)
- 江蘇眾紅生物工程創(chuàng)藥研究院有限公司馬永獲國家專利權(quán)
- 鹽城阿特斯協(xié)鑫陽光電力科技有限公司劉志強(qiáng)獲國家專利權(quán)
- 株式會社尼康柴崎祐一獲國家專利權(quán)
- 東京毅力科創(chuàng)株式會社后平拓獲國家專利權(quán)
- 法國圣戈班玻璃廠I.尤利爾羅謝獲國家專利權(quán)
- 甲骨文國際公司M·豪普特獲國家專利權(quán)


熱門推薦
- 應(yīng)用材料公司T·A·恩古耶獲國家專利權(quán)
- 青島海爾洗碗機(jī)有限公司史景文獲國家專利權(quán)
- 株式會社可樂麗岡本哲彌獲國家專利權(quán)
- 哈普恩治療公司霍爾格·韋舍獲國家專利權(quán)
- 強(qiáng)力物聯(lián)網(wǎng)投資組合2016有限公司查爾斯·霍華德·塞拉獲國家專利權(quán)
- 豪威科技股份有限公司約翰內(nèi)斯·索爾胡斯維克獲國家專利權(quán)
- 心鑒智控(深圳)科技有限公司羅曉忠獲國家專利權(quán)
- 福特全球技術(shù)公司默罕·卡魯卡獲國家專利權(quán)
- 新唐科技日本株式會社高山徹獲國家專利權(quán)
- 臺灣積體電路制造股份有限公司鄭宇彣獲國家專利權(quán)