代码之家 › 专栏 › 技术社区 › yurnero

Gridsearchcv:内部逻辑

scikit-learn machine-learning python

yurnero · 技术社区 · 4 年前

我试图理解Gridsearchcv的逻辑是如何工作的。我看着 here ,这位官员说 documentation ,以及源代码,但我无法理解以下内容:

Gridsearchcv背后的一般逻辑是什么?

澄清 :

这个问题 here 我也有同样的担心,但我不知道这些信息有多新,我也不确定我是否了解那里的所有信息。例如,根据OP,我的理解是:

这种理解正确吗?现在仍然适用吗?那么这个过程是如何将原来的25%-75%分割的呢?

1 回复 | 直到 4 年前

ombk 4 年前

首先,将数据分为训练和测试。测试集留作后期训练和模型优化之用。这个 gridsearchcv 获取75%的数据并将其分成5个部分。首先它训练4个切片并在1上进行验证,然后取4个切片引入之前遗漏的集进行验证并在新集上进行测试等等。。。5次。

然后可以看到每次运行的性能+它们的平均值,从而全面了解模型的行为。

推荐文章

July · 如何定义数字间隔,然后四舍五入

1 年前

Community wiki · 对象名称前的单下划线和双下划线的含义是什么?

1 年前

Brian Johnson · 为什么在Python中列出字典列表会引发TypeError?[已关闭]

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

Ashok Shrestha · 需要追踪特定的颜色线并获取坐标

1 年前

Nicote Ool · 在FastApi和Vue3中获得422

1 年前

NeoExceptCodeBad · 如果我有很多垂直线,我如何找到它们的边缘?

1 年前

Abdulaziz · 如何对集合内的列表进行排序[重复]

1 年前

user2743931 · 带有src目录的Python setup.py

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前