• <form id="tsg3z"></form>

    <thead id="tsg3z"></thead>
      <abbr id="tsg3z"><table id="tsg3z"><nav id="tsg3z"></nav></table></abbr>

    1. 男女性杂交内射女bbwxz,亚洲欧美人成电影在线观看,中文字幕国产日韩精品,欧美另类精品xxxx人妖,欧美日韩精品一区二区三区高清视频,日本第一区二区三区视频,国产亚洲精品中文字幕,gogo无码大胆啪啪艺术
      Document
      拖動滑塊完成拼圖
      個人中心

      預訂訂單
      服務訂單
      發布專利 發布成果 人才入駐 發布商標 發布需求

      在線咨詢

      聯系我們

      龍圖騰公眾號
      首頁 專利交易 IP管家助手 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 需求市場 關于龍圖騰
       /  免費注冊
      到頂部 到底部
      清空 搜索
      當前位置 : 首頁 > 專利喜報 > 南京航空航天大學吳巧云獲國家專利權

      南京航空航天大學吳巧云獲國家專利權

      買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

      龍圖騰網獲悉南京航空航天大學申請的專利基于脈沖混合強化學習的移動機器人避障運動規劃方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120406474B

      龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510926612.1,技術領域涉及:G05D1/43;該發明授權基于脈沖混合強化學習的移動機器人避障運動規劃方法是由吳巧云;易程;汪俊;李祥雨;王為周設計研發完成,并于2025-07-07向國家知識產權局提交的專利申請。

      基于脈沖混合強化學習的移動機器人避障運動規劃方法在說明書摘要公布了:本發明涉及移動機器人避障運動規劃技術領域,解決了移動機器人在靈活避障運動規劃過程中面臨能耗過高,以及自主導航能力和避障性能存在不足的技術問題,尤其涉及一種基于脈沖混合強化學習的移動機器人避障運動規劃方法,通過將脈沖神經網絡的低能耗特性與強化學習的靈活決策機制相結合,使移動機器人能夠在復雜環境中自主生成最優路徑,同時有效降低計算成本和能量浪費。本發明能夠有效提升移動機器人在動態環境中的避障性能,使其在復雜多變的環境中實現安全、高效的自主導航,使移動機器人在降低能耗的同時,仍能保持優異的性能表現,從而推動智能裝備在智能制造領域的廣泛應用和實用化進程。

      本發明授權基于脈沖混合強化學習的移動機器人避障運動規劃方法在權利要求書中公布了:1.一種基于脈沖混合強化學習的移動機器人避障運動規劃方法,其特征在于,該方法包括以下步驟: S1、移動機器人在任一次環境交互中,從傳感器獲取每一步場景中包括觀測值以及動作空間的觀測信息; S2、建立以觀測信息作為輸入,強化移動機器人在動態環境中對環境信息的感知,并輸出移動機器人在動態環境中規避障礙物所需執行動作指令的混合脈沖強化學習模型;所述混合脈沖強化學習模型包括: 一個群體編碼的編碼模塊,用以將觀測信息映射為多通道神經元的活動激活值,并生成固定時間步長的脈沖序列; 以脈沖序列作為輸入的脈沖神經網絡模塊,用于模擬生物神經元膜電位變化、突觸電流積累與脈沖觸發機制并輸出編碼活動; 以及,將脈沖神經網絡模塊輸出的編碼活動轉換為更直觀的動作空間表達的解碼模塊; S3、建立在移動機器人執行動作指令下用于引導移動機器人路徑規劃訓練的獎勵機制,具體過程包括: 如果移動機器人向目標移動,則按距離減小的比例給予正向獎勵,具體更新規則如下: ; 其中,表示在時間步,移動機器人到目標的歐幾里得距離; 若發現移動機器人越來越靠近障礙物時,則給予漸進的懲罰,具體公式如下: ; 其中,表示移動機器人距離障礙物的最小距離; 若移動機器人與障礙物的距離小于設定的障礙物半徑,即移動機器人與障礙物發生了碰撞,則給予懲罰并結束,即: ; 其中,、分別為移動機器人和障礙物的尺寸大小; 移動機器人與目標的距離小于目標范圍,即移動機器人成功到達目標點,則一次性給予大額獎勵并終止任務,即: ; 其中,表示目標點的范圍; 引入時間懲罰,并基于正向獎勵、懲罰、懲罰以及大額獎勵,獲得用于引導移動機器人路徑規劃訓練的總獎勵,表達式為: ; 其中,表示獎勵機制下的總獎勵; S4、對混合脈沖強化學習模型的參數進行優化,獲得用于指導移動機器人完成避障任務的最優運動路徑,具體過程包括以下步驟: S41、基于最大熵強化學習算法建立用于對混合脈沖強化學習模型的參數進行優化的深度強化學習框架,所述深度強化學習框架包括生成一個概率分布用于決定移動機器人動作的策略網絡,以及用來評估狀態-動作對價值的價值網絡; S42、以最小化策略損失和Q值損失來訓練策略網絡和價值網絡作為深度強化學習框架的訓練目標; S43、基于訓練目標,以最大化策略的期望回報,并最小化策略的熵作為優化策略損失的目標,表達式為: ; 其中,表示從經驗回放池D中隨機抽取樣本;表示熵正則化系數,用來平衡探索與利用;表示狀態和動作的值,和是價值網絡對同一狀態-動作對的兩個不同值估計; S44、基于獎勵機制計算混合脈沖強化學習模型對未來獎勵的預測,即: ; 其中,表示當前狀態和動作所獲得的獎勵;表示折扣因子,決定了未來獎勵的影響;表示當前策略下,動作在狀態下的對數概率,用于鼓勵移動機器人進行更多探索; S45、根據對未來獎勵的預測,使用雙Q網絡最小化損失函數來訓練價值網絡,即: ; 其中,表示價值網絡損失; S46、隨機初始化整個深度強化學習框架的參數,并使用Adam優化器更新各模塊的權重。

      如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京航空航天大學,其通訊地址為:210016 江蘇省南京市秦淮區御道街29號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

      免責聲明
      1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
      2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
      主站蜘蛛池模板: 一区二区三区四区激情视频| 国产超高清麻豆精品传媒麻豆精品 | 亚洲中文字幕人妻系列| 成人一区二区三区在线午夜| 亚洲精品成人综合色在线| 亚洲各类熟女们中文字幕| 加勒比无码人妻东京热| 久久精品免视看国产成人| 国产麻豆精品一区一区三区| 公喝错春药让我高潮| 亚洲色一区二区三区四区| 久久精品99国产精品日本| 深夜av免费在线观看| 国产成人免费午夜在线观看| 美欧日韩一区二区三区视频| 亚洲人妻精品一区二区| 女人与牲口性恔配视频免费| 国产精品亚洲二区在线看| 中国CHINA体内裑精亚洲日本| 综合色在线| 日韩伦理片一区二区三区| 欧美怡春院一区二区三区| 久久夜色撩人精品国产av| 成人精品一区二区三区四| 国产丝袜在线精品丝袜不卡| 蜜桃臀av在线一区二区| jizz视频在线观看| 久久精品av国产一区二区| 成人午夜大片免费看爽爽爽| 亚洲国产一区二区三区亚瑟 | 亚洲人妻一区二区精品| 18禁国产一区二区三区| 国产熟女激情一区二区三区| 久久天天躁夜夜躁狠狠85| 激情综合色综合久久综合| 97久久综合亚洲色hezyo| 久久天堂无码av网站| 国产激情艳情在线看视频| 久久婷婷成人综合色综合| 国内外成人综合免费视频| 亚洲成a人无码av波多野|