当前位置: 首页 > news >正文

机器学习之模型调优

交叉验证(Corss Validate)

将拿到的训练数据,分为训练和验证集。每次都更换不同的验证集,取平均值作为最终结果。

超参数调优-网格搜索(Grid Search)

通常情况下需要手动指定的参数(例如K-近邻算法中的K值)叫做超参数。需要对模型预设几种超参数组合,每组超参数都采用交叉验证来进行评估。最后选出最优参数组合建立模型。

API

  • sklearn.model_selection.GridSearchCV(estimator, param_grid=None,cv=None)
    • estimator: 估计器对象
    • param_grid: 估计器参数,字典。
      • {‘n_neighbors’:[1,3,5]}
    • cv: 交叉验证的折数

代码示例:使用交叉验证和网格搜索优化KNN算法中k值

from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.model_selection import GridSearchCV

iris = load_iris()
x_train, x_test, y_train, y_test = train_test_split(
    iris.data, iris.target, test_size=0.2, random_state=6)

transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)

x_test = transfer.transform(x_test)

estimator = KNeighborsClassifier()

# 参数字典
params = {'n_neighbors':[1,3,5,7]}

# 网格搜索交叉验证
estimator = GridSearchCV(estimator, param_grid=params, cv=10)

estimator.fit(x_train,  y_train)
y_predict = estimator.predict(x_test)
score = estimator.score(x_test, y_test)
print("score=", score)
print(estimator.best_params_,estimator.best_score_,estimator.best_estimator_)

相关文章:

  • 西安建设局网站地址/百度客户端在哪里打开
  • 微网站价格/西安seo搜推宝
  • 网站建设的pest分析/ip子域名大全
  • 网站制作切片/百度首页优化
  • 网站站群优化/天津优化网络公司的建议
  • 男朋友是做网站的赚钱不/手机最新产品新闻
  • 为行业赋能 助力行业客户业务大放异彩
  • docker 搭建 Nuget 服务器,CentOS,宝塔面板
  • ubuntu:自动加载第三方设备驱动
  • 155. SAP Smart Table 的 Personalization(个性化配置)
  • Redis高级篇之最佳实践
  • 百度工程师教你玩转设计模式(装饰器模式)
  • 深度!用“极速统一”,开启金融行业数据分析新范式
  • lvm 制作
  • 【方案开发】医用级人体体温计额温仪方案
  • 使用mpdf生成pdf文件
  • 全国数据治理认证DAMA-CDGA/CDGP(线上班)招生简章
  • 如何在Angular框架中更好地使用字体?一篇文章解答!