1
2
您可以将问题分解为四组随机用户:
如果有第三个标准,把问题分成八组。等等。 可能是人为的 确切地 50%2级和50%3级 二者都 一组用户,美国和加拿大。因为它应该是随机的,所以您可能会期望它会有更多的变化。另外,如果加拿大的三级用户不多,占总数的15%怎么办? 随着标准变得越来越有选择性,你自然就摆脱了总样本的随机性。最终,你可以有一长串的标准,这样你的用户中只有一个子集可以满足它,然后就没有随机性了。 回复你的意见:对,对于每种类型的问题,SQL并不是最好的解决方案。你最好用一个 迭代的 算法而不是基于单一集合的SQL查询。例如:
当然,如果你选择一个有助于平衡70/30%的国家比例,但不平衡50/50%的水平比例的行,就会变得很棘手。你是否丢弃它?另外,当您只选择了前几行时,您可能希望忽略这些比率。 正如@hogan评论的那样,这可能是一个无法解决的NP完全问题。但是很多这样的问题都有一个解决方案,它会给你一个“足够好”的结果,尽管不是一个可以证明的最佳结果。 |
ybou · 需要帮助从SQL 2005查询中删除过时的=*连接运算符 7 年前 |
Robert · 将多个分隔符分隔的字段视为不同的行 8 年前 |
hud · 执行存储过程会导致错误 8 年前 |
Gonzalo · 如何将存储过程的结果插入到新表中? 8 年前 |