鵬城實驗室王耀威獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉鵬城實驗室申請的專利大模型自動部署方法、裝置、設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120234016B 。
龍圖騰網通過國家知識產權局官網在2025-08-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510711093.7,技術領域涉及:G06F8/61;該發明授權大模型自動部署方法、裝置、設備及介質是由王耀威;李潘;侯奎;熊雪菲;鄭清芳;蔣冬梅設計研發完成,并于2025-05-29向國家知識產權局提交的專利申請。
本大模型自動部署方法、裝置、設備及介質在說明書摘要公布了:本公開提供了一種大模型自動部署方法、裝置、設備及介質,通過執行大模型自動部署方法,可以基于用戶端的輸入確定原始大模型、輕量大模型、目標設備的目標設備類型以及目標設備上所能運行的目標模型架構,并為了適配不同性能差異的目標設備,自動生成針對預先注冊的模型轉換服務的調度信息,由于模型蒸餾服務、模型蒸餾服務和模型部署服務都是預先注冊好的,因此在生成有向無環圖任務信息時無需人工干預,且通過有向無環圖任務信息約束了各個服務之間的執行順序,并在執行有向無環圖任務信息之后,可以依次調度各項服務,自動對大模型進行蒸餾、轉換等操作,并最終將轉換后的輕量大模型部署到目標設備上,就能提高大模型部署的效率和質量。
本發明授權大模型自動部署方法、裝置、設備及介質在權利要求書中公布了:1.一種大模型自動部署方法,其特征在于,包括: 獲取用戶端輸入的下游任務信息,并基于所述下游任務信息確定原始大模型、輕量大模型、目標設備的目標設備類型以及所述目標設備上所能運行的目標模型架構; 當所述原始大模型蒸餾到所述輕量大模型過程中的蒸餾設備類型與所述目標設備類型不一致,和所述輕量大模型的原始模型架構與所述目標模型架構不一致中的至少一項滿足時,生成針對預先注冊的模型轉換服務的調度信息; 構建針對預先注冊的所述原始大模型蒸餾到所述輕量大模型的模型蒸餾服務的調度信息,以及構建針對預先注冊的所述目標設備的模型部署服務的調度信息,并依次為所述模型蒸餾服務、所述模型轉換服務和所述模型部署服務的各項所述調度信息之間配置相鄰服務對應的調度依賴關系,基于所有的所述調度信息的順序和對應的所述調度依賴關系構建有向無環圖任務信息; 當所述有向無環圖任務信息運行時,基于各個所述調度信息先調度所述模型蒸餾服務將所述原始大模型蒸餾到所述輕量大模型上,再調度所述模型轉換服務將蒸餾后的所述輕量大模型轉換至所述目標設備類型或所述目標模型架構上,并調度所述模型部署服務將轉換后的所述輕量大模型部署到所述目標設備上; 其中,所述當所述有向無環圖任務信息運行時,基于各個所述調度信息先調度所述模型蒸餾服務將所述原始大模型蒸餾到所述輕量大模型上,再調度所述模型轉換服務將蒸餾后的所述輕量大模型轉換至所述目標設備類型或所述目標模型架構上,并調度所述模型部署服務將轉換后的所述輕量大模型部署到所述目標設備上,包括: 當所述有向無環圖任務信息運行時,基于各個所述調度信息依次調度所述模型蒸餾服務、所述模型轉換服務和所述模型部署服務; 當運行所述模型蒸餾服務時,將所述原始大模型蒸餾到所述輕量大模型上; 當運行所述模型轉換服務時,確定所依賴的所述模型蒸餾服務是否完成,并在所述模型蒸餾服務完成后,調度所述模型轉換服務將蒸餾后的所述輕量大模型轉換至所述目標設備類型或所述目標模型架構上; 當運行所述模型部署服務時,確定所依賴的所述模型轉換服務是否完成,并在所述模型轉換服務完成后,調度所述模型部署服務將轉換后的所述輕量大模型部署到所述目標設備上。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人鵬城實驗室,其通訊地址為:518000 廣東省深圳市南山區興科一街2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。