1
2
您可以将问题分解为四组随机用户:
如果有第三个标准,把问题分成八组。等等。 可能是人为的 确切地 50%2级和50%3级 二者都 一组用户,美国和加拿大。因为它应该是随机的,所以您可能会期望它会有更多的变化。另外,如果加拿大的三级用户不多,占总数的15%怎么办? 随着标准变得越来越有选择性,你自然就摆脱了总样本的随机性。最终,你可以有一长串的标准,这样你的用户中只有一个子集可以满足它,然后就没有随机性了。 回复你的意见:对,对于每种类型的问题,SQL并不是最好的解决方案。你最好用一个 迭代的 算法而不是基于单一集合的SQL查询。例如:
当然,如果你选择一个有助于平衡70/30%的国家比例,但不平衡50/50%的水平比例的行,就会变得很棘手。你是否丢弃它?另外,当您只选择了前几行时,您可能希望忽略这些比率。 正如@hogan评论的那样,这可能是一个无法解决的NP完全问题。但是很多这样的问题都有一个解决方案,它会给你一个“足够好”的结果,尽管不是一个可以证明的最佳结果。 |
ecology · 基于R中随机生成数集的子集列 2 年前 |
Alan Jones · 使用random从列表创建动态列表 2 年前 |
breking bed · 单击按钮时如何随机选择唯一编号 2 年前 |
Carrot Man · 如何让熊猫数据框随机填充1和0? 2 年前 |
Justin Arnold · 范围内的随机数不是随机数 2 年前 |
Menna Magdy · 如何使用非模型字段进行过滤? 2 年前 |