代码之家 › 专栏 › 技术社区 › Denver Dang

通过自举的置信区间

bootstrapping python

0

Denver Dang · 技术社区 · 6 年前

基本上,我观察到的数据是二进制数据,所以1或0。正是从这些数据(放入一个有三个参数的模型中),我试图估计参数值。

假设我的组群是500,我从我的组群中取一个样本,可能是100,然后再把样本乘以5倍,再把它扩大到500,然后再运行一次模拟,这会产生一些新的参数估计,然后再做1000-2000次,得到一系列的参数值,然后可以使用哪个来定义CI?

还是我在这里遗漏了什么?

1 回复 | 直到 4 年前

1

3

Denziloe 6 年前

这个问题与Python无关。我想你需要读一篇引导的介绍。”《统计学习导论》提供了一个很好的例子。我们的想法不是抽样100个——你必须抽样替换拿着 相同样本大小 (500). 是的,然后多次重新估计参数。然后有几种方法可以把所有这些估计值转换成一个置信区间。例如,可以使用它们来估计标准误差(采样分布的标准偏差),然后使用+/-2*se。