代码之家  ›  专栏  ›  技术社区  ›  mlee_jordan

预测类与相应概率在H2O上是矛盾的

  •  1
  • mlee_jordan  · 技术社区  · 6 年前

    我用H2O应用了一个二元分类,我简单地把我的集合分为3个部分,分别是训练、校准和测试。在训练和校准之后,我检查了测试集上的结果。这里是相应的部分:

    final_grid = H2OGridSearch(model=H2OGradientBoostingEstimator(model_id = 'contract_gbm2', 
                                        stopping_rounds = 5, stopping_tolerance = 1e-4, seed = 23,
                                        stopping_metric = "AUC",balance_classes = True,
                                        max_runtime_secs=300, calibrate_model=True, calibration_frame=valid,
    
                                        nfolds = 5),
                           hyper_params=hyper_params_gbm,search_criteria=search_criteria)
    

    我注意到预测的类和给定的概率并不总是一致的。见下表:

    enter image description here

    1 回复  |  直到 6 年前
        1
  •  2
  •   TomKraljevic    6 年前

    阈值为max-F1,而不是0.5。