上海松鼠課堂人工智能科技有限公司樊星獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉上海松鼠課堂人工智能科技有限公司申請的專利題目自動標注分類的方法和系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN111985193B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202011048811.0,技術領域涉及:G06F40/166;該發明授權題目自動標注分類的方法和系統是由樊星設計研發完成,并于2020-09-29向國家知識產權局提交的專利申請。
本題目自動標注分類的方法和系統在說明書摘要公布了:本發明提供了題目自動標注分類的方法和系統,其通過對目標題目進行拍攝和將拍攝得到的圖像轉換為相應的題目文本數據,并識別得到題目文本數據樣本分別包含的英文文本和中文文本,再根據該英文文本和該中文文本各自包含的詞匯類型得到其對應所屬的學科類型,并且進行適應性的標注,最后根據該標注的結果將目標題目自動分類到相應的題目集合中,這樣能夠對海量的不同類型目標題目進行有針對性的和高效的自動標注與分類,從而提高對題目進行深加工的效率和便于后續對題目進行分析處理。
本發明授權題目自動標注分類的方法和系統在權利要求書中公布了:1.題目自動標注分類的方法,其特征在于,其包括如下步驟: 步驟S1,對若干目標題目分別進行拍攝,以此獲得關于每一個所述目標題目的圖像信息,并對所述圖像信息進行文本數據轉換處理,從而獲得關于若干所述目標題目的題目文本數據樣本; 步驟S2,對所述題目文本數據樣本進行文本語種信息識別處理,以此獲得所述題目文本數據樣本對應的英文文本信息和中文文本信息; 步驟S3,對所述英文文本信息和所述中文文本信息進行詞語類型識別處理,以此獲得所述題目文本數據樣本對應的學科類型標注信息; 步驟S4,根據所述學科類型標注信息,將若干所述目標題目匹配劃分到不同題目集合中,從而實現對若干所述目標題目的自動分類; 其中,在所述步驟S2中,對所述題目文本數據樣本進行文本語種信息識別處理,以此獲得所述題目文本數據樣本對應的英文文本信息和中文文本信息具體包括: 根據下面公式1,對所述題目文本數據樣本進行文本語種信息識別處理,從而獲得所述題目文本數據樣本中包括的英文文本語義近似值和中文文本語義近似值: 在上述公式1中,TitleAn,Bm表示所述題目文本數據樣本中所包括的英文文本語義近似值和中文文本語義近似值共同組成的標題文本語義近似值,π表示圓周率,arctan表示反正切函數運算符號,An表示標題中第n個英文文本對應的文本語義近似值,Bm表示第m個中文文本對應的文本語義近似值,N表示所述英文文本信息包含的英文文本數據總數量、且其最大值為40,n的取值為1-40之間的任意整數,M表示所述中文文本信息包含的中文文本數據總數量、且其最大值為20,m的取值為1-20之間的任意整數,j表示所述題目文本數據樣本中任意一個中文文本字符按照米字格拆分形成八個區間、各個區間以向右橫軸方向按逆時針順序進行標記的編號數、且j的取值只能為1、2、3、4、5、6、7、8,lj表示所述任意一個中文文本字符的第j個區間對應的橫向長度,hj表示所述任意一個中文文本字符的第j個區間對應的縱向長度,表示所述任意一個中文文本字符對應橫向筆畫空間向量,表示所述任意一個中文文本字符對應縱向筆畫空間向量;fa表示所述題目文本數據樣本中任意一個英文文本字符對應的字符面積值,表示對所述題目文本數據樣本的英文文本字符的識別結果,表示對所述題目文本數據樣本的中文文本字符的識別結果; 以及, 在所述步驟S3中,對所述英文文本信息和所述中文文本信息進行詞語類型識別處理,以此獲得所述題目文本數據樣本對應的學科類型標注信息具體包括: 根據下面公式2,對所述英文文本信息和所述中文文本信息進行詞語類型識別處理,以此獲得所述題目文本數據樣本對應的學科類型標注信息: 在上述公式2中,Matchq,d表示所述題目文本數據樣本對應的學科類型標注匹配值,Q表示所述題目文本數據樣本包含的學科總數量,D表示所述題目文本數據樣本包含的英文詞語和中文詞語總數量,q表示取[1,Q]之間的任意正整數,d表示取[1,D]之間的任意正整數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人上海松鼠課堂人工智能科技有限公司,其通訊地址為:200237 上海市徐匯區宜州路188號2幢9層、10層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。