下面就继续跟随“玩转数据,轻松漫游”系列专题,继续解锁数据的神奇密码。
最近推出的宇宙漫游作品征集活动成功吸引了我的注意,于是我也跃跃欲试琢磨起了自己的作品。
接着点击“Search”按钮,跳转至数据详情页面,在左上角菜单栏中选择“Save As—CSV”即可完成数据集的下载。
1.2 数据清洗
获取到原始数据后,需要进行一定的预处理,进行数据清洗可以:
确保数据质量:原始数据可能包含重复、缺失、异常值或不一致的信息。
通过数据清洗,可以检测并修复这些问题,提高数据的准确性和完整性。
确保一致性:数据清洗有助于确保数据的一致性,使得相同类型的数据具有相同的格式、单位和范围,便于进行比较和分析。
# 返回重复的行数
print(data_delete_none.duplicated().sum())
我下载的数据中并没有重复的(返回值为0),很好!