Overview

做项目时出现过某些蛋白质序列出现O或者X等情况,导致计算出的PSSM矩阵也有问题。今天又遇到这种情况,在比对文件的时候,用到了两条文件操作的linux命令,记录一下。其他更多的内容参考之前Chris写的另一篇文章生物信息中常用的Linux命令

1. 按顺序合并文件

普通的合并文件可以直接用一个cat命令,而按顺序合并多个文件必须遍历这些文件,逐个合并。命令如下:

for ((i=1;i<=k;i++))do echo fileName$i;done | xargs -i cat {} >> newFileName

2.比较两个文件的区别

diff的不加参数的基本命令最常用。

diff file1 file2

参考资料

Shell脚本中使用for循环和cat命令实现按顺序合并文件