专题文章
时长:00:00更新时间:2024-10-14 12:00:46
数据清洗内容如下:数据分析的步骤;数据分析的步骤分为5步:数据清洗,构建模型,数据可视化。一、理解数据;整体上理解数据集中的的数据字段意义,需要理解数据集的数据类型:文本型,数值型,逻辑性,错误值。二、数据清洗;数据清洗也叫做数据预处理,一般进行数据清洗需要通过通过7个步骤进行处理: 选择子集,列名重命名,删除重复值,缺失值处理,一致化处理,数据排序处理,异常值处理。2.1 选择子集;即选择需要进行分析的数据集中的数据列,为避免干扰可对其他不参与分析的数列进行隐藏处理。2.2 列名重名命;若数据集中出现同样列名称,或含义相同的两个列名,为避免干扰分析结果则需要针对某一个数据列的列名进行重命名。2.3 删除重复值;删除数据中的重复数据值,注意只会保留重复数据的第一条数据。
查看详情