当前位置: 首页 > news >正文

每天五分钟机器学习:基于正则化方法解决算法模型的过拟合问题

为什么会出现过拟合?过拟合的模型正是由于假设函数中那些高次项导致的,如果那些高次项没有(也就是高次项的系数为0或者足够小),那么算法就能得到一个比较不错的模型了,也就不会出现过拟合问题了。

所以我们要做的就是使用一种方法在一定程度上减小这些高次项的系数θ的值,这就是正则化的基本思想。

正则化是如何进行的呢?举一个例子:

在这里插入图片描述

此时算法的优化目标,也就是最小化代价函数:
在这里插入图片描述

现在假如为了防止模型过拟合,我们要对特征x3和特征x4进行惩罚,也就是说我们要减少特征x3和特征x4的系数,也就是θ3和θ4 的大小。

如何才能在训练过程中使得θ3和θ4变小呢?

我们可以尝试将这个惩罚纳入代价函数中,这样就会使得算法模型选择较小一些的θ3和θ4,所以此时修改后的代价函数如下:
在这里插入图片描述

我们可以看出θ3²和θ4²都乘以了1000,那么θ3²和θ4²只要稍微大一点都会使得代价函数很大,所以为了最小化这个代价函数,算法只能让θ3和θ4足够小,也就是θ3≈0、θ4≈0,这样得到的假设能够恰当的拟合数据,最终得到很好的一个二次函数

相关文章:

  • 电子商务网站建设与管理读后感/百度资源搜索平台
  • 电子商务网站建设维护有没有欺骗/网络营销这个专业怎么样
  • 做网站行业统称叫什么行业/开鲁网站seo站长工具
  • 做彩平的网站/免费发外链
  • 北京网站做的好的公司简介/2024最火的十大新闻
  • ps做的网站首页/市场营销平台
  • k8s证书过期
  • python数据分析及可视化(八)pandas数据规整(层级索引、数据重塑、数据合并、数据连接)
  • 文件损坏打不开怎么办?excel文件修复,看看这些解决办法
  • 如何保护Excel的工作簿结构不被改动?
  • 刷爆leetcode第七期 0018
  • JDBC2:preparedStatement的优点(blob数据和批处理)
  • 小程序开发 |微信公众平台SpringBoot开发实例 │ OAuth2.0网页授权应用开发
  • Python快速刷题网站——牛客网 数据分析篇(十五)
  • Gated-SCNN: Gated Shape CNNs for Semantic Segmentation
  • 实用水文篇--SpringBoot整合Netty实现消息推送服务器
  • 使用JS和CSS实现图片的3D透视效果及动画
  • LeetCode栈与队列应用——739.每日温度