Python pandas数据清洗流程

   日期:2020-10-13     浏览:101    评论:0    
核心提示:1.导入表格数据1.导入方法read_excel# 导入数据import pandas as pdaimport matplotlib.pylab as pyla = pda.read_excel("D:\\迅雷下载\\工具\\表格\\练习.xls") # 路径使用双反斜杠,否则会报错print(len(a)) # 数据框的长度,是按行统计的2.发现缺失值先打开excel表,查看下有多少缺失值,缺失值是指值为0或空统计发现有10个缺失值,同理其他列也有部分缺失值然后着手把0值置

1.导入表格数据

1.导入方法read_excel

# 导入数据
import pandas as pda
import matplotlib.pylab as pyl

a = pda.read_excel("D:\\迅雷下载\\工具\\表格\\练习.xls")	# 路径使用双反斜杠,否则会报错
print(len(a))   # 数据框的长度,是按行统计的

2.发现缺失值

先打开excel表,查看下有多少缺失值,缺失值是指值为0或空

统计发现有10个缺失值,同理其他列也有部分缺失值
然后着手把0值置空,保证所有的缺失值都是统一形式,方便处理

b = ["price", "trade"]
for i in b:
    a[i][(a[i] == 0)] = None
# a["price"] == 0 判断语句,返回True或False ,对列表的每一个值进行判断,如果有0,该处值置为none,然后进行判断直至完成

3.缺失值处理

遍历所有的空值,统一赋值

x = 0
for j in b:
    for k in range(len(a)):
        if (a[j].isnull())[k]:  
            a[j][k] = 36
            x += 1
print(x)
 
打赏
 本文转载自:网络 
所有权利归属于原作者,如文章来源标示错误或侵犯了您的权利请联系微信13520258486
更多>最近资讯中心
更多>最新资讯中心
0相关评论

推荐图文
推荐资讯中心
点击排行
最新信息
新手指南
采购商服务
供应商服务
交易安全
关注我们
手机网站:
新浪微博:
微信关注:

13520258486

周一至周五 9:00-18:00
(其他时间联系在线客服)

24小时在线客服