发现所有错误y但效率低下在大数据量的情况下y手工清洗数据几乎

是不可能的

??

2??自动清洗x自动清洗是通过专门编写的计算机应用程序来进行数据

清洗这种方法能解决某个特定的问题y但不够灵活y特别是在清理过

程需要反复进行时??一般来说,数据清理一遍就达到要求的很少??y程序

复杂y清理过程变化时工作量大而且y这种方法也没有充分利用目前

数据库提供的强大的数据处理能力。

数据清洗主要是对缺失值重复值异常值和数据类型有误的数据

进行处理y数据清洗的内容主要包括四点