国产综合久久久久-狠狠色噜噜狠狠狠狠av-国产女人乱人伦精品一区二区-亚洲a∨国产av综合av下载-爱做久久久久久

首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 圖書情報與數字圖書館 > 數字圖書館論壇 > 基于改進TF-IDF-CHI算法的農業科技文獻文本特征抽取 【正文】

基于改進TF-IDF-CHI算法的農業科技文獻文本特征抽取

杜若鵬; 鮮國建; 寇遠濤 中國農業科學院農業信息研究所/農業農村部農業大數據重點實驗室; 北京100081
  • 特征抽取
  • 卡方統計
  • 文本分類
  • 農業科技文獻

摘要:針對相近農業科研領域文獻的文本特征信息高度重合的特點,以及傳統的文本特征抽取方法存在的不足,對TF-IDF算法進行優化并加以應用驗證。通過引入卡方檢驗值與特征詞頻修正因子等方式,對特征詞加權函數進行重構,形成改進的ImpTF-IDF-CHI方法。將該方法與文檔頻率法、信息增益法及TF-IDF3種傳統的文本特征抽取結果應用于樸素貝葉斯分類實驗,根據實驗結果判定方法的優劣性。通過4種方法的58組特征抽取與文本分類實驗,發現與前述的3種特征抽取方法相比,ImpTF-IDF-CHI方法抽取的特征詞,應用于文本分類的正確率最高,平均準確率達94%,F1值為0.844,證明該方法在對相近農業科研領域文本進行特征抽取方面,具有準確率高、穩定性好、主題詞代表性強等優點,可以有效地應用于此類文獻文本分類、特征表達、主題抽取等場景。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

投稿咨詢 文秘咨詢

數字圖書館論壇

  • 預計1-3個月 預計審稿周期
  • 0.34 影響因子
  • 科技 快捷分類
  • 月刊 出版周期

主管單位:中華人民共和國科學技術部;主辦單位:中國科學技術信息研究所

我們提供的服務

服務流程: 確定期刊 支付定金 完成服務 支付尾款 在線咨詢
主站蜘蛛池模板: 中文字幕无码乱人伦免费| 老司机亚洲精品影院| 成人综合网站| 动漫?奶头张开腿被?男同 | 激情内射亚洲一区二区三区爱妻| 亚州中文字幕午夜福利电影| 亚洲国产精品久久亚洲精品| 寂寞少妇做spa按摩无码| 澳门永久av免费网站| 麻豆av久久无码精品九九| 伊人大杳焦在线| 欧美人成精品网站播放| 午夜131美女爱做视频| 国产婷婷一区二区三区| 国产亚洲综合视频在线| 最新精品国偷自产在线老年人| 2020国产精品永久在线| 人妻夜夜爽天天爽三区麻豆av网站| 久久久久无码国产精品一区| 国产乱子伦精品无码专区| 国产成人精品aa毛片| 亚洲精品久久久久国产| 国产一区二区三区成人欧美日韩在线观看| 曰韩无码二三区中文字幕| 人妻系列无码专区久久五月天| 无码国产精成人午夜视频一区二区 | 无码人妻丰满熟妇区bbbbxxxx| 日日噜噜夜夜狠狠久久丁香五月| 精品无人区无码乱码毛片国产| 2020久久超碰国产精品最新| 亚洲欧美日韩国产制服另类| 五月丁香色综合久久4438| 亚洲老鸭窝一区二区三区| 国内露脸少妇精品视频| 6699嫩草久久久精品影院| 成人乱码一区二区三区av| 亚洲中文字幕无码永久| 9色国产深夜内射| 亚洲欧美中文字幕5发布| 国产大片黄在线观看| 99re热免费精品视频观看|