日常机器学习(十三)pandas常用函数

pandas中的 mean() 函数可以不带缺失值进行求均值。下面是读取进来的数据
然后我用了两种方法去求 salary 中的均值。第一种是先去除 salary 中的 NaN 数值,然后对剩下的值进行求均值。第二种方法是直接调用pandas中的 mean() 函数求得均值。两种方法得到的结果相同。
在pandas中也可以按照某个指标统计数据。首先在原有数据上加上性别这一栏数据,然后对性别这一栏数据分别对male和female进行数据统计。下面的代码是关于如何在原数据上添加列,并对某一变量进行函数分析的例子。
这里主要用到pivot函数
当aggfunc不填入时,默认为求平均值。同样也可以同时对多项进行统计。
pandas中的dropna函数可以指定某一列(axis=1)或者某一行(axis=0)进行有关na数据的删除。
pandas中的loc函数可以查看某一样本的某一属性值
值得注意的是这里用的是方括号,而不是圆括号。
在panads中sort_values函数可以对数据中的某一项变量进行排序:
可以看到第一列的默认的index值混杂了。我们可以用reset_index函数得到新的index
pandas可以用自定义函数。可以用apply去调用
使用def函数也可以对某一列的值进行数据替换,加上(axis=1)

评论

此博客中的热门博文

日常机器学习(二十三)线性预测回归实例——缺失值处理