代码之家  ›  专栏  ›  技术社区  ›  Ray

回归问题,当使用l1、l2和r2时如何解释基线结果

  •  -1
  • Ray  · 技术社区  · 6 年前

    我试图解释我一直在研究的回归问题的结果。这个项目是关于估计急诊室的等候时间。我在一开始创建了一个基线,它是来自数据集的等待时间的中值。该基线用作地面基准,其目标是模型应优于基线ofc。

    我使用线性回归和随机森林,计算了l1范数,l2范数和r2值。在决定选择哪种型号更好时,我如何知道哪种型号的权重最高?或者这有可能吗?

    结果显示,r2的得分较低,低于0.10,而且l1似乎没有超过基线,但l2在每个模型中都更好。

    我知道我的数据是不好的,这也验证了可视化的自变量与依赖(等待时间),但有困难选择哪一个模型来选择(如果应该选择)。

    1 回复  |  直到 6 年前
        1
  •  0
  •   user2974951    6 年前

    这些都不是真正的性能值。使用标准的性能指标,如准确性或MSE,分别用于分类和回归。您可以使用交叉验证或单独的测试集来估计这些值。