代码之家 › 专栏 › 技术社区 › Stefano Potter

利用统计模型预测置信区间

statsmodels python

Stefano Potter · 技术社区 · 6 年前

我正在建立这样的线性模型:

import statsmodels.api as sm
from statsmodels.stats.outliers_influence import summary_table
import numpy as np
import random

x = np.arange(1,101, 1)
y = random.sample(range(1,1000), 100)

X = sm.add_constant(x)
regr = sm.OLS(y, X)
fit = regr.fit()

st, data, ss2 = summary_table(fit, alpha=0.05)

我可以确定标准误差和置信区间 data .

现在,我想预测一下新数据的置信区间是多少,我正这样尝试:

new_data = [102, 103, 104, 105]

fit.get_prediction(new_data)

但这又回来了:

Traceback (most recent call last):

  File "<ipython-input-168-372d2610946d>", line 14, in <module>
    fit.get_prediction(new)

  File "/Users/spotter/anaconda3/lib/python3.6/site-packages/statsmodels/regression/linear_model.py", line 2138, in get_prediction
    weights=weights, row_labels=row_labels, **kwds)

  File "/Users/user/anaconda3/lib/python3.6/site-packages/statsmodels/regression/_prediction.py", line 163, in get_prediction
    predicted_mean = self.model.predict(self.params, exog, **pred_kwds)

  File "/Users/user/anaconda3/lib/python3.6/site-packages/statsmodels/regression/linear_model.py", line 261, in predict
    return np.dot(exog, params)

ValueError: shapes (1,4) and (2,) not aligned: 4 (dim 1) != 2 (dim 0

1 回复 | 直到 6 年前

Jan K 6 年前

由于您使用截获对模型进行了培训,因此在创建时还需要包含它 new_data (=添加1列)。

new_data = sm.add_constant([102, 103, 104, 105])
result = fit.get_prediction(new_data)
result.conf_int()

推荐文章

July · 如何定义数字间隔,然后四舍五入

1 年前

Community wiki · 对象名称前的单下划线和双下划线的含义是什么?

1 年前

Brian Johnson · 为什么在Python中列出字典列表会引发TypeError?[已关闭]

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

Ashok Shrestha · 需要追踪特定的颜色线并获取坐标

1 年前

Nicote Ool · 在FastApi和Vue3中获得422

1 年前

NeoExceptCodeBad · 如果我有很多垂直线,我如何找到它们的边缘?

1 年前

Abdulaziz · 如何对集合内的列表进行排序[重复]

1 年前

user2743931 · 带有src目录的Python setup.py

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前