![]() |
1
1
请试验一下 JPMML-SparkML 图书馆(或其) PySpark2PMML 或 Sparklyr2PMML 前端),看看具体是如何不同的阿帕奇火花变压器和模型映射到PMML标准。 例如,PMML标准不提供专门的“删除停止字”元素。相反,所有低级文本操作都是使用通用的 TextIndex 和 TextIndexNormalization 元素。停止字的删除被表示为/实现为一个regex转换,在该转换中,它们被简单地替换为空字符串。要评估这样的PMML文档,您的运行时必须只提供基本的regex功能——绝对不需要ApacheSark运行时或它的Transformer和ModelAlgorithms/Classes。 从ApacheSparkML到PMML的翻译工作异常出色(例如,覆盖范围比其他翻译方法(如MLEAP)要好得多)。 |