• <span id="pfyta"><output id="pfyta"><strike id="pfyta"></strike></output></span><span id="pfyta"><output id="pfyta"><nav id="pfyta"></nav></output></span>
    <span id="pfyta"><blockquote id="pfyta"></blockquote></span>
  • <optgroup id="pfyta"></optgroup><track id="pfyta"><em id="pfyta"></em></track>
    科學研究
    首頁 >> 科學研究 >> 科研成果 >> 正文
    信控學院張勇教授、王衍虎碩士、鞏敦衛教授在高維不平衡特征選擇方面取得進展

    信控學院張勇教授、王衍虎碩士、鞏敦衛教授在高維不平衡特征選擇方面取得進展

    圖片1

    所提算法框架圖

    隨著大數據時代的到來,高維數據在實際應用中越來越普遍。為了防止丟失重要信息,決策者獲取的原始數據往往包含大量冗余或不相關的特征。這些冗余/不相關的特征會增加學習算法的計算成本,甚至降低其學習性能。特征選擇的目的是從原始特征集中選擇一個特征子集,在最大化給定性能指標的同時降低學習成本。已有特征選擇方法不僅無法有效同時解決數據缺失和類不平衡等問題,而且存在“維數災難”等問題。

    近日,信控學院智能優化與控制課題組張勇教授、王衍虎碩士和鞏敦衛教授在該領域取得研究進展,提出了一種聚類引導的粒子群特征選擇算法,研究成果形成了論文“Clustering-guided particle swarm feature selectionalgorithm for high-dimensional imbalanced datawith missing values”,該論文以中國礦業大學為第一單位,發表在中科院一區期刊《IEEE Transactions onEvolutionary Computation(IF: 11.554)。論文第一作者為張勇教授,通訊作者為王衍虎碩士和鞏敦衛教授。

    該成果首次提出了填充風險的定義,并給出了基于填充風險的F測度(RF測度)。隨后,以RF測度作為目標函數,提出了一種聚類引導的PSO特征選擇算法。RF測度可以評估特征子集處理缺失不平衡數據的質量,克服傳統F測度未考慮缺失數據的不足。提出的模糊聚類策略能夠將大量特征劃分成多個組,僅使用每組中的代表特征來構建特征子集。這樣既減小了種群的搜索范圍,又提高了個體的評價代價。此外,在局部修剪策略與種群初始化策略的幫助下,所提算法不僅顯著減少了所選特征的數量,而且提高了所選特征子集的分類性能。

    該成果為含缺失高維不均衡數據提供了一種有效的進化特征選擇算法。在多個典型實際數據集上的應用表明,所提算法能夠在較短的運行時間內獲得分類性能好的特征子集。

    上一篇:信控學院智能優化與控制課題組在移動群智感知任務分配方面取得進展

    下一篇:2017年至現在主要獲獎

    掃碼關注
    天天爱天天做天天爽2021