暂无介绍
引言 在大数据阶段,数据重点性日益凸显,可是,大规模数据集中重复数据、冗余特征不止会占用大量存储空间,还会降低数据分析效能、准确性,于是,如何有效地处理大规模数据集中重复数据、冗余特征变成数据分析领域一个重点课题,本文将从重复构成概念、特点、三种类型冗余分析、如何处理这些冗余以及它们对数据分析影响等