1
39
这是 罗布鲁斯卡 脚本清理了一点:
我删除
如果你想得到幻想,你可以用
编辑
使用GNU
可读性:
什么时候?
一个过滤器脚本或函数可以对输出内容甚至文件名进行任何它想要的操作。后者的一个示例可能是输出到变量目录中的固定文件名:
|
2
11
您可以在gnu coreutils split>=8.13(2011)中使用新的--filter功能:
|
3
10
您可以使用[MG]AWK:
100是每个切片的行数。 它不需要临时文件,可以放在一行上。 |
4
4
说到巴什福,我是个新手,但我能编造出这两个命令怪物。我相信还有更优雅的解决方案。
这是假设您的输入文件是
|
5
2
这是一个更强大的版本 丹尼斯·威廉姆森 剧本。这个脚本创建了很多临时文件,如果运行不完整而让它们到处乱放,那就太可惜了。那么,让我们添加信号捕获(请参见 http://tldp.org/LDP/Bash-Beginners-Guide/html/sect_12_02.html 然后 http://tldp.org/LDP/abs/html/debugging.html )删除我们的临时文件;无论如何这是一个最佳实践。
用所需的返回代码替换“13”。哦,而且您可能无论如何都应该使用mktemp(正如一些人已经建议的那样),所以继续从陷阱行的rm中删除“tmp_文件”。有关要捕获的更多信号,请参阅信号手册页。 |
6
2
这将把大的csv分成999行,每个行的顶部都有标题。
基于ole tange的答案。 (关于OLE的答案:不能将行计数与pipepart一起使用) |
7
1
我从不确定直接从其他人的网站复制脚本的规则,但是
Geekology
有一个很好的脚本来做你想做的事情,有一些评论确认它是有效的。一定要做
|
8
1
我喜欢awk版本的marco,它采用了简化的一行程序,您可以轻松地指定拆分分数为所需的粒度:
|
9
1
我真的很喜欢Rob和Dennis的版本,所以我想改进一下。 这是我的版本:
差异:
|
10
1
使用GNU并行:
如果您需要对每个部分运行一个命令,那么GNU Parallel也可以帮助您做到这一点:
如果要将每个CPU核心分成2个部分(例如,24个核心=48个同等大小的部分):
如果要拆分为10 MB块:
|
11
1
下面是一个可用于保存csv头的4行程序(使用:head、split、find、grep、xargs和sed) csvheader=`head -1 bigfile.csv` split -d -l10000 bigfile.csv smallfile_ find .|grep smallfile_ | xargs sed -i "1s/^/$csvheader\n/" sed -i '1d' smallfile_00 说明:
|
John Smith · 在特定行的末尾添加文本 2 年前 |
AndrewLeonardi · 居中并左对齐-引导 6 年前 |
deadlyvices · 在WPF中精确定位glyph文本 6 年前 |
jared-nelsen · 更改文本字段的大小和行为 6 年前 |
Ezeeroc · div元素未更改其文本内容 6 年前 |
Ally · 在位图上绘制长字符串会导致绘图问题 6 年前 |
Kevin Brophy · 在全屏视频上放置文本 6 年前 |