浪潮軟件科技有限公司李照川獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉浪潮軟件科技有限公司申請的專利一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120029517B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510503462.3,技術(shù)領(lǐng)域涉及:G06F3/04883;該發(fā)明授權(quán)一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng)是由李照川;林一偉;王冠軍;張堯臣;林杰;王金超;張慶鑫;王珂琛設(shè)計研發(fā)完成,并于2025-04-22向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng)在說明書摘要公布了:本發(fā)明公開了一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng),屬于操作系統(tǒng)與人工智能融合技術(shù)領(lǐng)域,本發(fā)明要解決的技術(shù)問題為常規(guī)智能體系統(tǒng)在國產(chǎn)化生態(tài)中存在的行為感知敏感度差、偏好變更響應(yīng)滯后、決策可解釋性低,采用的技術(shù)方案為:該系統(tǒng)是融合操作行為感知與強化學習技術(shù),通過操作感知引擎、人類反饋強化學習中樞、MCP協(xié)議適配器以及思維鏈可視化設(shè)計器形成感知?建模?優(yōu)化?解釋的完整技術(shù)閉環(huán),實現(xiàn)智能體從被動執(zhí)行向主動協(xié)同的范式躍遷;其中,通過操作感知引擎實時捕獲并解析用戶行為數(shù)據(jù),獲取操作序列數(shù)據(jù),將操作序列數(shù)據(jù)作為特征輸入到強化學習中樞,強化學習中樞輸出操作指令。
本發(fā)明授權(quán)一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng)在權(quán)利要求書中公布了:1.一種基于國產(chǎn)化操作系統(tǒng)的智能體服務(wù)系統(tǒng),其特征在于,該系統(tǒng)是融合操作行為感知與強化學習技術(shù),通過操作感知引擎、人類反饋強化學習中樞、MCP協(xié)議適配器以及思維鏈可視化設(shè)計器形成感知-建模-優(yōu)化-解釋的完整技術(shù)閉環(huán),實現(xiàn)智能體從被動執(zhí)行向主動協(xié)同的范式躍遷; 其中,通過操作感知引擎實時捕獲并解析用戶行為數(shù)據(jù),獲取操作序列數(shù)據(jù),將操作序列數(shù)據(jù)作為特征輸入到強化學習中樞,強化學習中樞輸出操作指令,MCP協(xié)議適配器將強化學習中樞推薦的操作指令通過標準化的接口與不同的數(shù)據(jù)源和服務(wù)進行交互,獲取操作指令對應(yīng)的結(jié)果,并將外部系統(tǒng)的反饋傳遞回人類反饋強化學習中樞,不斷優(yōu)化人類反饋強化學習中樞的策略網(wǎng)絡(luò);思維鏈可視化設(shè)計器將人類反饋強化學習中樞復雜的決策過程和數(shù)據(jù)關(guān)系轉(zhuǎn)換為直觀的可視化視圖,并指導人類反饋強化學習中樞的調(diào)整和優(yōu)化,形成閉環(huán)優(yōu)化過程; 強化學習中樞包括: 模型訓練模塊,用于進行行為-文件多模態(tài)聯(lián)合概率模型訓練; 優(yōu)化引擎建立模塊,用于建立雙通道反饋驅(qū)動的策略優(yōu)化引擎,實現(xiàn)行為-文件多模態(tài)聯(lián)合概率模型的優(yōu)化; 隱私保護與安全模塊,用于利用隱私保護與安全機制實現(xiàn)強化學習中樞中的隱私保護; 模型訓練模塊工作過程具體如下: (1)對每個操作行為分別計算相應(yīng)的操作頻率、持續(xù)時間和路徑復雜度三個維度的特征值;其中,操作頻率是指統(tǒng)計用戶在特定時間段內(nèi)對每個操作行為的執(zhí)行次數(shù),反映用戶對不同操作行為的使用頻率;持續(xù)時間是指記錄用戶在每個操作行為上花費的時間,體現(xiàn)用戶對不同操作的關(guān)注程度和投入時間的多少;路徑復雜度是指分析用戶在執(zhí)行操作時的路徑復雜程度,衡量用戶操作路徑的復雜性; (2)將用戶的不同操作行為視為詞匯,將用戶的一系列操作序列視為文檔,利用TF-IDF算法量化用戶對不同類型操作行為的偏好權(quán)重W,具體公式如下; ; 其中,表示詞匯t在文檔Di中出現(xiàn)次數(shù);表示文檔中所有詞匯的詞數(shù);N表示文檔總數(shù);表示文檔是否包含詞匯t,若包含為1,不包含為0; (3)利用用戶對不同類型操作行為的偏好權(quán)重和三維特征值,將所有操作序列數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的特征向量,作為行為-文件多模態(tài)聯(lián)合概率模型訓練的輸入; (4)通過動態(tài)貝葉斯網(wǎng)絡(luò)計算操作行為與文件訪問行為的聯(lián)合概率分布,將用戶在不同時間點的操作序列與文件訪問行為建模為條件概率分布,捕捉操作行為與文件訪問之間的因果關(guān)系; (5)將結(jié)構(gòu)化的特征向量輸入多層神經(jīng)網(wǎng)絡(luò),多層神經(jīng)網(wǎng)絡(luò)輸出為操作建議的概率分布,采用監(jiān)督學習方法,通過歷史行為數(shù)據(jù)訓練行為-文件聯(lián)合概率模型,構(gòu)建操作序列與文件訪問的時空關(guān)聯(lián),動態(tài)更新概率分布以反映用戶行為的時序性和上下文依賴性; (6)通過交叉驗證和指標評估驗證行為-文件多模態(tài)聯(lián)合概率模型性能,確保模型的泛化能力; 優(yōu)化引擎建立模塊的工作過程具體如下: (1)設(shè)計反饋通道,反饋通道包括顯式反饋通道和隱式反饋通道;其中,顯式通道通過用戶界面接收用戶對智能建議的星級評分,評分范圍為1-5級;隱式通道通過眼動追蹤記錄用戶在操作過程中的注視點、掃視路徑和瞳孔變化,并記錄用戶在特定操作或界面元素上的停留時間,通過眼動和停留時長數(shù)據(jù)計算認知負荷指標;再將評分與認知負荷指標轉(zhuǎn)化為數(shù)值化的反饋信號,作為強化學習的獎勵函數(shù)輸入; (2)結(jié)合顯式和隱式反饋信號設(shè)計獎勵函數(shù),顯式反饋直接作為獎勵值,隱式反饋通過認知負荷指標間接影響?yīng)剟睿?(3)采用PPO算法計算行為-文件多模態(tài)聯(lián)合概率模型策略網(wǎng)絡(luò)的梯度更新,通過截斷策略更新確保訓練的穩(wěn)定性;其中,PPO算法采用多目標優(yōu)化,通過最小化路徑熵優(yōu)化用戶操作路徑,并通過最大化敏感操作混淆度,提高敏感操作的不可識別性,保護用戶隱私。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人浪潮軟件科技有限公司,其通訊地址為:250000 山東省濟南市高新區(qū)浪潮路1036號浪潮科技園;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。


熱門推薦
- 晶元光電股份有限公司許啟祥獲國家專利權(quán)
- LG電子株式會社具文模獲國家專利權(quán)
- 西安艾潤物聯(lián)網(wǎng)技術(shù)服務(wù)有限責任公司王林祥獲國家專利權(quán)
- 成都中技智慧企業(yè)管理咨詢有限公司請求不公布姓名獲國家專利權(quán)
- 深圳市比克動力電池有限公司林森獲國家專利權(quán)
- 顧澤蒼獲國家專利權(quán)
- 北方民族大學張白獲國家專利權(quán)
- 慧與發(fā)展有限責任合伙企業(yè)N·愛德華茲獲國家專利權(quán)
- 南通帝誠華信實業(yè)有限公司張云清獲國家專利權(quán)
- 豪倍公司D·里奇?zhèn)カ@國家專利權(quán)