当前位置：首页 > news >正文

第二章.线性回归以及非线性回归—特征缩放，交叉验证法，过拟合

news 来源：原创 2024/11/14 13:33:33

第二章.线性回归以及非线性回归

2.9 特征缩放

1.数据归一化

1).作用：

把数据的取值范围处理为0-1或者-1-1

2).数据范围处理为0-1之间的方法：

newValue=(oldValue-min)/(max-min)
例如：数组:（1,3,5）,value1:(1-1)/(5-1)=0; value2:(3-1)/(5-1)=0.5; value3:(5-1)/(5-1)=1

3).数据范围处理为-1-1之间的方法：

newValue=（(oldValue-min)/(max-min)-0.5)*2
例如：数组:（1,3,5）,value1:((1-1)/(5-1)-0.5)*2=-1; value2:((3-1)/(5-1)-0.5)*2=0; value3:((5-1)/(5-1)-0.5)*2=1

2.均值标准化

1).方法：

newValue=（(oldValue-u)/s[x:特征数据；u:数据的平均值；s:数据的方差]
例如：x=(1,3,5,7,9)
①.u=(1+3+5+7+9)/5
②.s=((1-5)²+(3-5)²+(5-5)²+(7-5)²+(9-5)²)/5=8
③.(1-5)/8=-0.5
④.(3-5)/8=-0.25
⑤.(5-5)/8=0
⑥.(7-5)/8=0.25
⑦.(9-5)/8=0.5

2.10 交叉验证法:

1.交叉验证法是一种验证方法：

在这里插入图片描述

说明：白色的方框：代表训练集，蓝色方框：代表测试集.
模型用训练集训练，用测试集测试，会得到一个误差值E，迭代10次，每次用的测试集的位置是不同的，用的就是交叉验证的思想

2.11 过拟合:

1.回归描述：

在这里插入图片描述

说明：
①.正确拟合:测试集和训练集表现的都比较好
①.过拟合:训练集表现比较好，测试集表现的比较差

2.分类描述：

在这里插入图片描述

说明：
①.正确拟合:测试集和训练集表现的都比较好
①.过拟合:训练集表现比较好，测试集表现的比较差

3.防止过拟合的方法：

1).减少样本特征（有些数据的特征是干扰性）

2).增加数据量（基本上数据量越大，效果越好）

3).正则化（Regularized）

正则化的代价函数分为两种
参数说明：
λ：正则项的系数

相关文章：

网站建设怎么评估/营销网络推广哪家好

建设网站制/安卓手机优化大师官方下载

建站之星安装说明/百度贴吧官网app下载

wordpress大学主题1.3/最佳磁力吧cili8

wordpress文章页面没有格式调整/alexa排名查询

怎么给公司注册网站/新能源汽车公司

SpreadJS.Release.16.0.2 Crack by Xacker

Spring、SpringMVC、SpringBoot、SpringCloud 框架常用注解说明

【教学赛】金融数据分析赛题1：银行客户认购产品预测（0.9676）

Java图形化界面---JOptionPane

ubuntu20.04下出现protoc与gazebo版本问题

通信电子、嵌入式类面试题刷题计划03

[ECE]模拟试题-7

作为java工程师这些概念要理清(一)

安科瑞智能仪表在密集母线行业中的应用

nacos在国产银河麒麟系统飞腾CPU部署安装

PaddleNLP开源UTC通用文本分类技术，斩获ZeroCLUE、FewCLUE双榜第一

musl pwn 入门 (2)