• <form id="tsg3z"></form>

    <thead id="tsg3z"></thead>
      <abbr id="tsg3z"><table id="tsg3z"><nav id="tsg3z"></nav></table></abbr>

    1. 男女性杂交内射女bbwxz,亚洲欧美人成电影在线观看,中文字幕国产日韩精品,欧美另类精品xxxx人妖,欧美日韩精品一区二区三区高清视频,日本第一区二区三区视频,国产亚洲精品中文字幕,gogo无码大胆啪啪艺术
      Document
      拖動滑塊完成拼圖
      個人中心

      預(yù)訂訂單
      服務(wù)訂單
      發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標 發(fā)布需求

      在線咨詢

      聯(lián)系我們

      龍圖騰公眾號
      首頁 專利交易 IP管家助手 科技果 科技人才 科技服務(wù) 國際服務(wù) 商標交易 會員權(quán)益 需求市場 關(guān)于龍圖騰
       /  免費注冊
      到頂部 到底部
      清空 搜索
      當前位置 : 首頁 > 專利喜報 > 廈門淵亭信息科技有限公司;湖南淵亭智能科技有限公司黃在斌獲國家專利權(quán)

      廈門淵亭信息科技有限公司;湖南淵亭智能科技有限公司黃在斌獲國家專利權(quán)

      買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!

      龍圖騰網(wǎng)獲悉廈門淵亭信息科技有限公司;湖南淵亭智能科技有限公司申請的專利一種大模型訓(xùn)練數(shù)據(jù)合成方法、系統(tǒng)、設(shè)備及存儲介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120409710B 。

      龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510907023.9,技術(shù)領(lǐng)域涉及:G06N5/04;該發(fā)明授權(quán)一種大模型訓(xùn)練數(shù)據(jù)合成方法、系統(tǒng)、設(shè)備及存儲介質(zhì)是由黃在斌;錢智毅設(shè)計研發(fā)完成,并于2025-07-02向國家知識產(chǎn)權(quán)局提交的專利申請。

      一種大模型訓(xùn)練數(shù)據(jù)合成方法、系統(tǒng)、設(shè)備及存儲介質(zhì)在說明書摘要公布了:本發(fā)明提出了一種大模型訓(xùn)練數(shù)據(jù)合成方法、系統(tǒng)、設(shè)備及存儲介質(zhì),包括:對原始軍事語料數(shù)據(jù)進行預(yù)處理,使用預(yù)訓(xùn)練語言模型生成語義向量,通過聚類分析將語義向量劃分為多個主題簇,提取各主題簇的關(guān)鍵詞及代表樣本,形成主題本體庫;基于主題相似度矩陣選取關(guān)聯(lián)主題對,通過預(yù)定義模板生成合成樣本;通過提示詞指令控制合成樣本的語言風格,生成風格化樣本;劃分風格化樣本的難度等級,獲得分級樣本;對分級樣本進行多維度質(zhì)量評估與篩選,獲得篩選樣本;將篩選樣本用于訓(xùn)練大語言模型,根據(jù)大語言模型在各主題任務(wù)的性能表現(xiàn),調(diào)整主題權(quán)重、更新合成策略和優(yōu)化樣本結(jié)構(gòu)。本發(fā)明能為大模型訓(xùn)練提供高質(zhì)量、多樣化的訓(xùn)練數(shù)據(jù)。

      本發(fā)明授權(quán)一種大模型訓(xùn)練數(shù)據(jù)合成方法、系統(tǒng)、設(shè)備及存儲介質(zhì)在權(quán)利要求書中公布了:1.一種大模型訓(xùn)練數(shù)據(jù)合成方法,其特征在于,包括以下步驟: S1、從多源渠道采集原始軍事語料數(shù)據(jù),對所述原始軍事語料數(shù)據(jù)進行清洗、標準化處理、去重與結(jié)構(gòu)化轉(zhuǎn)換,形成基礎(chǔ)軍事語料數(shù)據(jù); S2、使用預(yù)訓(xùn)練語言模型生成所述基礎(chǔ)軍事語料數(shù)據(jù)的語義向量,通過聚類分析將所述語義向量劃分為多個主題簇,所述主題簇包括:作戰(zhàn)指揮、武器裝備、戰(zhàn)術(shù)戰(zhàn)法、后勤保障和電子對抗,提取各主題簇的關(guān)鍵詞及代表樣本,形成主題本體庫,具體包括以下子步驟: S21、使用BERT模型將所述基礎(chǔ)軍事語料數(shù)據(jù)的每個文本si編碼為固定維度向量,并使用平均池化方式輸出整段文本的語義向量; S22、對所述語義向量進行K-Means聚類分析,獲得聚類結(jié)果; S23、基于所述聚類結(jié)果構(gòu)建所述主題本體庫,包括:以聚類中心向量表征主題語義特征;通過TF-IDF算法提取各主題簇的關(guān)鍵詞;選取距離簇中心最近的N個樣本作為代表樣本,N表示大于0的自然數(shù); 對所述主題本體庫中的代表樣本進行語義重寫、句式重構(gòu)或上下文補全,生成擴展樣本,并將所述擴展樣本加入所述主題本體庫的代表樣本; S3、基于所述主題本體庫的主題相似度矩陣選取關(guān)聯(lián)主題對,通過預(yù)定義模板生成融合多主題上下文的合成樣本,具體包括以下子步驟: S31、基于主題相似度矩陣計算值,選取相似度高于設(shè)定閾值的關(guān)聯(lián)主題對; S32、為每個所述關(guān)聯(lián)主題對設(shè)計結(jié)構(gòu)化融合的預(yù)定義模板,所述預(yù)定義模板包括:設(shè)定交集話題邏輯連接結(jié)構(gòu)和構(gòu)造問題模板; S33、調(diào)用Qwen模型對所述關(guān)聯(lián)主題對應(yīng)用所述預(yù)定義模板生成合成樣本; S4、通過提示詞指令控制所述合成樣本的語言風格,生成風格化樣本,包括:通俗表達樣本、正式命令體樣本;基于文本長度、結(jié)構(gòu)復(fù)雜度、詞匯難度及推理步驟數(shù)劃分所述風格化樣本的難度等級,獲得分級樣本; S5、對所述分級樣本進行多維度質(zhì)量評估與篩選,獲得篩選樣本; S6、將所述篩選樣本用于訓(xùn)練大語言模型,根據(jù)所述大語言模型在各主題任務(wù)的性能表現(xiàn),調(diào)整主題權(quán)重、更新合成策略和優(yōu)化樣本結(jié)構(gòu)。

      如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人廈門淵亭信息科技有限公司;湖南淵亭智能科技有限公司,其通訊地址為:361000 福建省廈門市軟件園二期望海路61號801單元N8-01;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

      免責聲明
      1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
      2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。
      主站蜘蛛池模板: 亚洲av永久无码精品水牛影视| 成在线人永久免费视频播放| 欧美肥老太交视频免费| 一本大道久久香蕉成人网| 在线播放国产精品三级网| 国产成人片无码视频| 亚洲人成人网站色www| 色欲久久人妻内射| 国产小受被做到哭咬床单GV| 永久黄网站色视频免费直播| 久久蜜臀av一区三区| 免费看亚洲一区二区三区| 精品亚洲综合一区二区三区| 国产精品人妇一区二区三区| 国产一区二区三区在线看| 国产精品国产三级国产专i| 国产中文字幕在线一区| 久久亚洲色WWW成人男男| 丁香五月亚洲综合在线国内自拍| 婷婷久久综合九色综合88| 美女无遮挡免费视频网站| 国产另类ts人妖一区二区| 无码免费大香伊蕉在人线国产| 国产乱久久亚洲国产精品| 玩两个丰满老熟女久久网| 精品国产成人一区二区| 亚洲精品成人久久av| 亚洲精品久久久久久无码色欲四季 | 日韩有码中文字幕一区二区| 国产一区二区三区麻豆视频| 国产精品黄色一区二区三区| 你拍自拍亚洲一区二区三区| 中文字幕日韩一区二区不卡| 国产蜜臀视频一区二区三区| 99久久精品一区二区国产| 国产成人精品国产成人亚洲| 国产精品黄色一区二区三区| 不卡视频在线一区二区三区| 四虎成人精品国产永久免费| 香蕉久久夜色精品国产成人| 亚洲综合精品一区二区三区|