![]() |
1
0
|
![]() |
2
0
让我们分析一下步骤: 第一步:OHE 步骤1.1:确定类别 流读取您的数据点,收集所有类别。不必保存读取的数据点。 步骤1.2:转换数据 在步骤1.1之后,每个数据点都可以独立转换。所以流读取,转换,流写入。您在任何时候都只需要内存中的一个或很少的数据点。 步骤1.3:特征选择 研究特性选择以减少内存占用和提高性能可能是值得的。这个 answer 基于熵的特征选择方法依赖于所有的数据。虽然你也可以把一些数据流放在一起,但在过去,一种对我很有效的方法是删除只有一个或两个数据点的特征,因为这些特征的熵很低,可能对分类器帮助不大。这可以像步骤1.1和步骤1.2一样再次执行 第二步:打击 第三步:培训
|
![]() |
Dave Johnson · RDP-打印机驱动程序不正确 11 年前 |