1
2
statsmodels中的RLM仅限于M估计量。默认的Huber范数仅对y中的异常值具有鲁棒性,而对x中的异常值不具有鲁棒性,即对不良影响点不具有鲁棒性。 参见示例 http://www.statsmodels.org/devel/examples/notebooks/generated/robust_models_1.html [51]和之后的行。 像bisquare这样的重新设计规范能够消除不利的影响点,但解是局部最优解,需要适当的起始值。具有低崩溃点且对x异常值(如LTS)具有鲁棒性的方法目前在statsmodels中不可用,在Python的任何其他地方也不可用。R有一套更广泛的稳健估计量,可以处理这些情况。在statsmodels中添加更多方法和模型的一些扩展。健壮的请求处于当前暂停的pull请求中。
在特定情况下,通常很难将观察值声明或识别为异常值。研究人员经常使用稳健的方法来表明 离群候选人 这需要进一步调查。例如,一个原因可能是“异常值”是从不同的人群中采样的。在许多情况下,使用纯机械的统计识别可能不合适。 在本例中:如果我们拟合一个陡坡,并将点a作为异常值,那么点B和C可能拟合得相当好,并且不会被识别为异常值。另一方面,如果A是基于额外信息的合理点,则关系可能是非线性的。 我的猜测是,LTS将声明A为唯一的异常值,并拟合一条陡峭的回归线。 |
July · 如何定义数字间隔,然后四舍五入 1 年前 |
user026 · 如何根据特定窗口的平均值(行数)创建新列? 1 年前 |
Ashok Shrestha · 需要追踪特定的颜色线并获取坐标 1 年前 |
Nicote Ool · 在FastApi和Vue3中获得422 1 年前 |
Abdulaziz · 如何对集合内的列表进行排序[重复] 1 年前 |
asmgx · 为什么合并数据帧不能按照python中的预期方式工作 1 年前 |