日常机器学习(二十五)线性预测回归实例——预处理问题
数据预处理时,一般需要将数据进行归一化(标准化)处理,这时可以用到StandScaler()函数: 要预测的变量"Petal.area"设为target,其他的x变量放入features中,归一化结果如上图所示。 除了归一化以外,可以看到"Species"这一项分类项也想用数字化的思想去分类。这时候可以用到get_dummies()函数。如这个"Species"中现在有三个类别"setosa","versicolor","virginica"。那么get_dummies()函数会生成三列指标,并用0或1表示是否属于该类别,如下图: 最后对数据划区,分别化成训练区和测试区,train_test_split()函数可以帮忙直接根据比例划分: