代码之家  ›  专栏  ›  技术社区  ›  Chris Cudmore

概率问题-从大篮子中选择时重复

  •  2
  • Chris Cudmore  · 技术社区  · 16 年前

    我需要向客户解释为什么在两次假定不同的考试之间出现重复。从Prob和Stats开始已经20年了。

    我有一个选择题考试。 数据库中有192个问题, 随机选择100个(无重复)。

    我如何计算存在的概率 50次? 75次?

    --事后编辑-- 我通过excel运行了这个,从n-100中取概率之和, 对于这个特殊的问题,概率是

    n   P(n+ dupes)
    40  97.5%
    52  ~50% 
    61  ~0
    
    3 回复  |  直到 11 年前
        1
  •  2
  •   Mike F Mike F    16 年前

    呃,这对我来说真的很模糊。但是有(192选100)种可能的考试,对吗?

    那么,选择N个重复的概率不只是:

    (100选择N)*(92选择100-N)/(192选择100)

    编辑:所以如果你想有机会 N或更多 重复而不是精确的N,您必须将该分数的上半部分相加,以获得N的所有值,从最小重复数到100。

    呃,也许。。。

        2
  •  1
  •   Airsource Ltd    16 年前

    一旦你创建了第一个考试,就有92个问题从未使用过,100个问题已经使用过。如果您现在生成另一个考试,其中包含100个问题,那么您将从92个从未使用过的问题中选择,100个已经使用过。很明显,你会得到相当多的副本。

    如果你想知道概率是25,或者75,或者别的什么,那么你有两个选择。

    a) 算出这道数学题

    b) 在计算机上模拟几次运行

        3
  •  0
  •   Chris    16 年前

    它可能比你想象的要高。我不会试图复制这篇文章: http://en.wikipedia.org/wiki/Birthday_paradox