方差 偏差 学习曲线 正则化参数

高偏差 : 对于训练数据没能很好的拟合  对新数据的泛化能力当然也差   这时候主要 增加属性  或者多项式  还有降低lamda   高方差 :对于训练数据过度拟合  导致对新数据的泛化能力很差  这时候主要是 选择更小的属性组合  或者增加数据集  还有增加lamda       Lamda作为正则参数 对Jtrain 和 Jcv的影响 Jcv主要是再未对模型进行测试之前 进行的模式选择,你可想是第一次测试模型   最终再用第二次测试数据评估算法   我们知道 随着Lamda的增大 训练数据的 j是逐渐增大  lamda越大  训练误差也越大   而验证误差lamda太小   处于 过度拟合

查准率 和召回率

对这两个的理解一直不够透彻,看了NG的视频豁然开放 其实为什么要搞这个玩意哪 ? 单纯的预测准确率不能完整的体现算法模型的好坏 比如100个数据里面有 5个是1  其余为了 0 任意一个模型都可以将预测结果输出为了0,那也就是准确率为95%   可是深入查看 才知道 预测完全错误而且没有任何意义 因此 Precision 和Recall 就是很重要的评估参数         Precision=True positives/predicted as positive =True positives/True positives + False positives   //预测对的值(ypredicted=1 and yacutal=1)除以所有预测为对的值(ypredicted=1 ) Recall=True positives/acutal as positive