基于距离覆盖的属性约简算法

君宇 王, 璐 李, 冰冰 史, 子轩 葛, 丽红 李

摘要


在属性约简过程中,加速属性重要度的计算非常重要,尤其是对于大数据情况。针对传统属性约简算法过分依赖样本数据集大小,造成算法时间复杂度增加的问题,提出一种基于距离覆盖的属性约简算法。首先对原始数据集进行归一化处理;其次计算属性间的欧氏距离,得到基于距离的自反对称矩阵,并根据距离形成覆盖;然后根据每个属性被覆盖的次数进行属性约简;最后以 CART 算法作为预测工具,根据预测的准确率选择最佳约简。实验结果表明,该算法切实可行,且约简后的数据集分类精度良好,为属性约简提供了新思路。

关键词


属性约简;距离覆盖;欧氏距离;CART 算法

全文:

PDF

参考


邬阳阳,汤建国.大数据背景下粗糙集属性约简研究进展[J].计算机工程与应用,2019,55(6):31-38+177.

Yao Y Y, Zhao Y. Attribute reduction in decision-theoretic rough set models[J]. Information Sciences,2008,178(17):3356-3373.

刘桂枝.维度变化的不完备混合型数据增量式属性约简[J].计算机工程与应用,2021,57(12):161-169.

Hu M, Tsang E, Guo Y T, et al. A novel approach to attribute reduction based on weighted neighborhood rough sets[J].Knowledge-Based Systems,2021,220(5):106908.

陈曦,刘晶.基于邻域关系的知识粒度增量式属性约简算法[J].微电子学与计算机,2020,37(10):1-6.

代琪,李敏,刘洋,等.模糊层次商空间的快速属性约简算法[J].计算机工程与应用,2021,57(4):55-60.

Tsang E, Chen D G, Yeung D. Approximations and reducts with covering generalized rough sets[J]. Computers and Mathematics with Applications,2006,56(1):279-289.

游小英,李进金.基于证据理论的覆盖类决策多粒度粗糙集的下 近似约简[J].模糊系统与数学,2020,34(5):133-138.

许晴媛,李进金.集覆盖问题的粗糙集属性约简方法[J].模糊系统与数学,2021,35(1):80-91.

Che X Y, Mi J S, Chen D G. Information fusion and numerical characterization of a multi-source information system[J]. Knowledge-Based Systems,2018(145):121-133.

吴尚智.基于粗糙集的一种属性值约简算法及其应用[J].计算机应用与软件,2009,26(2):263-265.

邹艳,陈伟杰,董景荣.基于偏好间欧氏距离的加权交叉效率评价模型[J].统计与决策,2021,37(6):167-170.

Huang J Z, Huang W, Ni J. Predicting bitcoin returns using highdimensional technical indicators[J]. The Journal of Finance and Data Science,2019,5(3):140-155.




DOI: https://doi.org/10.12346/sde.v3i7.3873

Refbacks

  • 当前没有refback。