代码之家  ›  专栏  ›  技术社区  ›  Marco

调谐器插入符号长度

  •  -1
  • Marco  · 技术社区  · 6 年前

    我在跟踪一个 caret 使用 Sonar 内置数据集。该数据集由208行和61个特征/变量组成(如果该类被丢弃,则为60个)。

    在一个步骤中,它解释了 trainControl train 功能如下:

    # Model training controller (cross-validation with 3 reps)
    control <- trainControl(method="repeatedcv", repeats=3)
    
    myModel <- train (Class ~ ., 
               data=train_partition,
               method="pls",
               preProc=c("scale"),
               trControl=control,
               tuneLength=3)
    

    当我展示 火车 文档 tuneLength 参数指定为:

    An integer denoting the amount of granularity in the tuning parameter grid. 
    By default, this argument is the number of levels for each tuning parameters that 
    should be generated by train. If trainControl has the option search = "random", 
    this is the maximum number of tuning parameter combinations that will be generated 
    by the random search. (NOTE: If given, this argument must be named.)
    

    文件第一行中规定的“pls”方法的“调整参数”是什么?

    1 回复  |  直到 6 年前
        1
  •  0
  •   Mankind_2000    6 年前

    中的“调整参数” 插入符号 指的是超参数,在算法开始学习之前,需要为其提供值。

    偏最小二乘法 ( 'pls' ),有一个超参数: 'ncomp' i、 e成分/潜在因素的数量。从理论上讲,数据集中的要素/变量数量与组件数量相同。对于 声纳 数据你有60个特征。

    在实际应用中,由于冗余特性,您需要较少的组件来解释模型中的巨大差异。因此,您需要在1到50之间进行调整,以评估最佳性能。