![]() |
1
2
假设行数足够大,大#定律可以生效,并且不需要精确到1%(只是非常接近),可以执行以下操作:
这将顺序扫描整个文件一次,以获得行,但它不会保留在内存中的整个文件。它将一行一行地迭代,并且只在内存中保留随机选择的~1%的行。如果您不想将文件加载到内存中,也不想先扫描它以计数行,那么这可能是最好的方法。
如果您确实需要它正好占行数的1%,并且/或者需要它也适用于较小的文件,那么您可以扫描该文件一次,以计算文件中的总行数
|
![]() |
2
0
例如
|
![]() |
user026 · 如何根据特定窗口的平均值(行数)创建新列? 1 年前 |
![]() |
rpn · 如何在列[1]中连续第二次出现“0”时返回列[0]的值 1 年前 |
![]() |
asmgx · 为什么合并数据帧不能按照python中的预期方式工作 1 年前 |
|
Domarius · 使用loc为多行设置多列值 1 年前 |
![]() |
msts1906 · 大熊猫向乳胶的适当多品种出口 1 年前 |