山東大學;浪潮云信息技術股份公司胡鵬飛獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉山東大學;浪潮云信息技術股份公司申請的專利一種異構GPU系統及數據傳輸方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119718676B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510205701.7,技術領域涉及:G06F9/50;該發明授權一種異構GPU系統及數據傳輸方法是由胡鵬飛;肖雪;劉晉堯;李超群;唐曉東;吳思;李峰;王剛;談果戈;成秀珍設計研發完成,并于2025-02-25向國家知識產權局提交的專利申請。
本一種異構GPU系統及數據傳輸方法在說明書摘要公布了:本申請屬于GPU技術領域,具體涉及一種異構GPU系統及數據傳輸方法,包括訪問接口模塊和數據傳輸模塊;所述訪問接口模塊:封裝不同GPU的原生內存管理接口,并提供一致的內存訪問接口;基于libibverbs的單邊語義設計GPU內存傳輸接口;所述數據傳輸模塊:使用GDR和RDMA傳輸原語實現對遠程異構GPU內存的直接數據傳輸;設置雙數據緩沖區,發送方和接收方各自維護兩個駐留在GPU內存中的數據緩沖區,這些緩沖區通過統一的GPU內存訪問接口進行分配。其優點在于,本申請設計統一的顯存操作接口與通信接口,支持異構GPU間的顯存互操作。
本發明授權一種異構GPU系統及數據傳輸方法在權利要求書中公布了:1.一種異構GPU系統,其特征在于,包括訪問接口模塊、數據傳輸模塊、狀態緩沖區和雙數據緩沖區,所述狀態緩沖區和雙數據緩沖區分別駐留在主機內存和GPU內存中; 所述訪問接口模塊:封裝不同GPU的原生內存管理接口,并提供一致的內存訪問接口;基于libibverbs的單邊語義設計GPU內存傳輸接口; 所述數據傳輸模塊:使用GDR和RDMA傳輸原語實現對遠程異構GPU內存的直接數據傳輸;設置雙數據緩沖區,發送方和接收方各自維護兩個駐留在GPU內存中的數據緩沖區,這些緩沖區通過統一的GPU內存訪問接口進行分配; 狀態緩沖區用于消息同步,其控制了數據傳輸過程:在主機內存的兩側維護狀態緩沖區,并通過單邊寫操作來同步消息,當發送方完成對接收方的數據寫入后,它會更新發送方狀態緩沖區中的消息并將其發送至接收方,接收方在成功檢測到該消息后,開始讀取已發送的數據,從而確保了同步和高效的數據處理; 雙數據緩沖區用于流水線數據傳輸:發送方和接收方各自維護兩個駐留在GPU內存中的數據緩沖區,用于存儲實際數據;這些緩沖區通過統一的GPU內存訪問接口進行分配;在數據傳輸過程中,一個緩沖區用于GPU內存復制,同時另一個緩沖區用于通過網絡傳輸數據;在下一周期,兩個緩沖區的角色互換; 流水線雙緩沖區數據傳輸策略: 階段1:發送方將數據塊復制到一個數據緩沖區,同時向接收方發送消息,通知待發送數據的總大小,發送方和接收方可以根據該信息計算所需的傳輸迭代次數; 階段2:發送方在數據緩沖區上發布兩個寫入事件;第一個事件用于將實際數據寫入遠程GPU內存,第二個事件用于向接收方同步可讀性消息,這兩個事件在同一QP上按順序發布,以確保RDMA的有序執行;同時,發送方開始將數據復制到第二個數據緩沖區; 階段3:一旦接收方檢測到可讀性通知,它會立即從其數據緩沖區中復制數據到應用程序內存,并向發送方發送一個可寫性通知,與此同時,第二個數據緩沖區開始接收網絡數據,無論數據復制和RDMA寫入的延遲如何,對同一內存區域的下一個RDMA寫入都會在復制完成之后發生; 當前迭代完成后立即接收到下一個可讀性通知,當GPU內存復制延遲在消息大小低于某個閾值時高于RDMA寫入延遲,可以通過將數據緩沖區的大小配置為接近該閾值來實現上述目標,通過這種流水線設計,將RDMA數據傳輸延遲隱藏在GPU內存復制延遲中,降低大塊數據傳輸的網絡傳輸延遲。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人山東大學;浪潮云信息技術股份公司,其通訊地址為:266200 山東省青島市即墨區濱海路72號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。