太極計算機(jī)股份有限公司;中電科大數(shù)據(jù)研究院有限公司韓國權(quán)獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉太極計算機(jī)股份有限公司;中電科大數(shù)據(jù)研究院有限公司申請的專利數(shù)據(jù)處理方法及裝置獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN116467427B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-15發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202310323580.7,技術(shù)領(lǐng)域涉及:G06F16/335;該發(fā)明授權(quán)數(shù)據(jù)處理方法及裝置是由韓國權(quán);呂灝;陳輪;祁綱;黃海峰;灑科進(jìn);李響設(shè)計研發(fā)完成,并于2023-03-29向國家知識產(chǎn)權(quán)局提交的專利申請。
本數(shù)據(jù)處理方法及裝置在說明書摘要公布了:本申請?zhí)峁┮环N數(shù)據(jù)處理方法及裝置,所述方法包括:得到原始醫(yī)學(xué)知識數(shù)據(jù)集對應(yīng)的各類簇;對所述各類簇進(jìn)行離群檢測處理,如果類簇中數(shù)據(jù)點(diǎn)的總數(shù)小于設(shè)定閾值或類簇中不包含標(biāo)簽為醫(yī)學(xué)教材的醫(yī)學(xué)數(shù)據(jù),則將類簇中的所有醫(yī)學(xué)數(shù)據(jù)放入離群點(diǎn)候選集中;根據(jù)離群點(diǎn)候選集中數(shù)據(jù)點(diǎn)的標(biāo)簽對所述離群點(diǎn)候選集進(jìn)行剪枝處理;對剪枝后的離群點(diǎn)候選集中的數(shù)據(jù)點(diǎn)進(jìn)行離群處理。本發(fā)明實(shí)施例提供的數(shù)據(jù)處理方法及裝置,通過專門適用于該應(yīng)用場景的改進(jìn)聚類和離群算法,對原始醫(yī)學(xué)知識數(shù)據(jù)中的離群數(shù)據(jù)進(jìn)行篩選處理,還通過專門適用于該應(yīng)用場景數(shù)據(jù)特點(diǎn)的剪枝算法,既保證離群處理的計算效率,也最大限度地保留了可用的醫(yī)學(xué)知識數(shù)據(jù)。
本發(fā)明授權(quán)數(shù)據(jù)處理方法及裝置在權(quán)利要求書中公布了:1.一種數(shù)據(jù)處理方法,其特征在于,所述方法包括: 對所獲取的原始醫(yī)學(xué)知識數(shù)據(jù)集中的醫(yī)學(xué)數(shù)據(jù)進(jìn)行初始聚類,得到所述原始醫(yī)學(xué)知識數(shù)據(jù)集對應(yīng)的各類簇; 對所述各類簇進(jìn)行離群檢測處理,所述離群檢測處理包括:如果類簇中數(shù)據(jù)點(diǎn)的總數(shù)小于設(shè)定閾值或類簇中不包含標(biāo)簽為醫(yī)學(xué)教材的醫(yī)學(xué)數(shù)據(jù),則將類簇中的所有醫(yī)學(xué)數(shù)據(jù)放入離群點(diǎn)候選集中;否則,依次計算類簇中各數(shù)據(jù)點(diǎn)到類簇中心的距離,并將距離大于半徑且標(biāo)簽不是醫(yī)學(xué)教材的醫(yī)學(xué)數(shù)據(jù)放入離群點(diǎn)候選集中;其中,所述類簇中心為所述類簇中標(biāo)簽為醫(yī)學(xué)教材的醫(yī)學(xué)數(shù)據(jù)的矢量化均值; 基于聚類算法,根據(jù)離群點(diǎn)候選集中數(shù)據(jù)點(diǎn)的標(biāo)簽對所述離群點(diǎn)候選集進(jìn)行剪枝處理,得到剪枝后的離群點(diǎn)候選集; 對剪枝后的離群點(diǎn)候選集中的數(shù)據(jù)點(diǎn)進(jìn)行離群處理,確定數(shù)據(jù)點(diǎn)是否為離群點(diǎn); 其中,所述基于聚類算法,根據(jù)離群點(diǎn)候選集中數(shù)據(jù)點(diǎn)的標(biāo)簽對所述離群點(diǎn)候選集進(jìn)行剪枝處理,具體包括: 對于標(biāo)簽為網(wǎng)絡(luò)文章的數(shù)據(jù)點(diǎn),當(dāng)其在任意一輪聚類過程中離其聚類中心的距離為最遠(yuǎn)時,對該數(shù)據(jù)點(diǎn)進(jìn)行剪枝處理; 對于標(biāo)簽為電子病例的數(shù)據(jù)點(diǎn),當(dāng)其在任意一輪聚類過程中離其聚類中心的距離為最遠(yuǎn)時,通過醫(yī)學(xué)詞典將該數(shù)據(jù)點(diǎn)進(jìn)行矢量重計算,若使該數(shù)據(jù)點(diǎn)離聚類中心的距離變小,則保留矢量重計算后的數(shù)據(jù)點(diǎn),否則對該數(shù)據(jù)點(diǎn)進(jìn)行剪枝處理; 對于標(biāo)簽為語音文本的的數(shù)據(jù)點(diǎn),當(dāng)其在任意一輪聚類過程中離其聚類中心的距離為最遠(yuǎn)時,計算該數(shù)據(jù)點(diǎn)的其他同族數(shù)據(jù)點(diǎn)離聚類中心的平均距離與該數(shù)據(jù)點(diǎn)到聚類中心距離的比值,若該比值小于轉(zhuǎn)換所述語音文本所使用的語音識別模型的準(zhǔn)確率,對該數(shù)據(jù)點(diǎn)進(jìn)行剪枝處理。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人太極計算機(jī)股份有限公司;中電科大數(shù)據(jù)研究院有限公司,其通訊地址為:100083 北京市海淀區(qū)北四環(huán)中路211號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 華為技術(shù)有限公司張立斌獲國家專利權(quán)
- 桂林橡膠設(shè)計院有限公司張俊獲國家專利權(quán)
- 中鐵上海工程局集團(tuán)華海工程有限公司王孝樂獲國家專利權(quán)
- 華為技術(shù)有限公司陳東國獲國家專利權(quán)
- 臺灣積體電路制造股份有限公司李健瑋獲國家專利權(quán)
- 韋伯斯特生物官能(以色列)有限公司A.戈瓦里獲國家專利權(quán)
- 北京南風(fēng)科創(chuàng)應(yīng)用技術(shù)有限公司方勵獲國家專利權(quán)
- 東風(fēng)商用車有限公司劉夏獲國家專利權(quán)
- 寧波先鋒中央電暖科技有限公司姚裕初獲國家專利權(quán)
- 高通股份有限公司周志兵獲國家專利權(quán)


熱門推薦
- 華為技術(shù)有限公司劉航獲國家專利權(quán)
- 舍弗勒技術(shù)股份兩合公司萊因哈特·馬利克獲國家專利權(quán)
- 華為技術(shù)有限公司李帥獲國家專利權(quán)
- 大和制衡株式會社津川久志獲國家專利權(quán)
- 山東聚亨源環(huán)保科技有限公司張正均獲國家專利權(quán)
- 東京毅力科創(chuàng)株式會社岡澤智樹獲國家專利權(quán)
- 上海夏凱建筑科技有限公司謝強(qiáng)獲國家專利權(quán)
- 現(xiàn)代自動車株式會社河在濬獲國家專利權(quán)
- 大和制衡株式會社長井孝幸獲國家專利權(quán)
- 福州高意光學(xué)有限公司賈旭獲國家專利權(quán)