blaire
👩🏻💻星洲小课堂 SinClass
我们训练好了一个 Model
以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。
这次主要介绍两种保存Model的模块 pickle
与 joblib
交叉验证(cross validation)让我们知道在机器学习中验证是有多么的重要, 这一次的 sklearn 中我们用到了sklearn.learning_curve
当中的另外一种, 叫做validation_curve
,用这一种曲线我们就能更加直观看出改变模型中的参数的时候有没有过拟合(overfitting)的问题了. 这也是可以让我们更好的选择参数的方法.
Sklearn 中的 learning curve
可以很直观的看出我们的 model
学习的进度, 对比发现有没有 overfitting
的问题. 然后我们可以对我们的 model
进行调整, 克服 overfitting
的问题.
Sklearn 中的 Cross-validation
对于我们选择正确的 Model
和 Model 的参数
是非常有用, 有了它我们能直观的看出不同 Model 或者参数对结构准确度的影响。
Data Normalization 可以提升机器学习的成效
Sklearn 把所有机器学习的模式整合统一起来了,学会了一个模式就可以通吃其他不同类型的学习模式
今天来看 Model
的属性和功能, 这里以 LinearRegressor
为例,所以先导入包,数据,还有模型
Sklearn 中的 data sets,很多而且有用,可以用来学习算法模型
Sciki-learn 选择学习方法,选择模型 流程图