日常机器学习(二十)线性回归算法概述 获取链接 Facebook X Pinterest 电子邮件 其他应用 十一月 09, 2019 线性拟合表示对一个应变量(y),有一系列的元素(xp)(元素也可以理解为自变量),我们想得到一个线性回归方程 这里,p 表示自变量的个数,i 表示数据个数。(PS:会有一个常数项) 也可以写成一个矩阵形式 其中 获取链接 Facebook X Pinterest 电子邮件 其他应用 评论
日常机器学习(二十三)线性预测回归实例——缺失值处理 十一月 18, 2019 使用missingno中的包,可以画出缺失值的位置: 白色的位置表示缺失值位置。(详情可以参见https://github.com/ResidentMario/missingno) pd.isnull()可以显示数据中缺失的那一部分,代入到原数据中,就可以显示出缺失的那一部分的数据值。 对于缺失的数据如何填补,我们可以先画该数据的累积分布函数(ECDF函数可以画累积分布函数,详情package参照第二十二篇)或柱状分布函数来看看该数据的具体分布。 groupby()函数可以根据括号中的选项来对原数据进行分类 transform函数可以替换原数据中的缺失值。 可以看到在'Sepal.Width'中原来的缺失值使用'setosa'这一类的平均值来替换掉。 阅读全文
日常机器学习(十七)Matplotlib条形图与散点图 十一月 02, 2019 用numpy中的random函数随机生成1000个(1,100)的数。在collections包中有一个Counter函数,可以用来统计数据的频率。画条形图时,需要用到subplot( ),因为在figure()中没有条形图的函数。data.bar()可以用来画条形图。 第一个参数是x数值,第二个参数是height值,第三个参数是每个条形的宽度。 同样的,也可以横着画条形图。data.barh()函数可以画。 使用data.scatter()函数可以画散点图。set_xlabel(), set_ylabel()可以用来设置横坐标和纵坐标的名字。 阅读全文
评论
发表评论