代码之家  ›  专栏  ›  技术社区  ›  Doug Knesek

统计问题

  •  2
  • Doug Knesek  · 技术社区  · 15 年前

    假设我对10个人进行了一项调查,询问他们是否将一部电影列为0到4颗星。允许回答为0、1、2、3和4。

    平均值是2.0星。

    如何计算2.0星级的确定性(或不确定性)?理想情况下,我想要一个介于0和1之间的数字,其中0表示完全不确定度,1表示完全确定度。

    显然,10个人选择(2,2,2,2,2,2,2,2,2,2,2,2,2,2)的情况是最确定的,而10个人选择(0,0,0,0,0,0,4,4,4,4,4,4)的情况是最不确定的。(0,1,1,2,2,2,2,3,3,4)应该在中间。

    4 回复  |  直到 14 年前
        1
  •  6
  •   Rob Hyndman    15 年前

    标准偏差没有请求的属性。当每个人都选择相同的答案时,它是零;当有5个0和5个4时,它可以和sqrt(40/9)=2.11一样好。

    我建议你使用1-stdev(x)/sqrt(40/9),当每个人都同意的时候,它的值为1,当有5个0和5个4时,它的值为0。

        2
  •  3
  •   Andrew Shepherd    15 年前

    你所追求的功能是 standard deviation .

    您的三个示例的标准偏差是0(表示无偏差)、2.1(大偏差)和1.15(介于两者之间)。

        3
  •  0
  •   Russell Newquist    15 年前

    你想要的叫做 standard deviation .

        4
  •  0
  •   James    14 年前

    您应该考虑平均值是否是此类信息的适当统计。一部电影被评为两颗星是一部被评为四颗星的两倍吗?

    用百分位测量(如中位数)来表示中心趋势,用百分位范围(如IQR)来测量“确定性”,可能会更好地为您服务。正如上面的答案一样,确定性最大的值是0,因为您确实在测量偏离中心趋势的程度。

    顺便说一句,一项对10个人的调查太小了,不能用有意义的统计分析来做太多的工作。