Overview
做项目时出现过某些蛋白质序列出现O
或者X
等情况,导致计算出的PSSM
矩阵也有问题。今天又遇到这种情况,在比对文件的时候,用到了两条文件操作的linux
命令,记录一下。其他更多的内容参考之前Chris
写的另一篇文章生物信息中常用的Linux命令。
1. 按顺序合并文件
普通的合并文件可以直接用一个cat
命令,而按顺序合并多个文件必须遍历这些文件,逐个合并。命令如下:
for ((i=1;i<=k;i++))do echo fileName$i;done | xargs -i cat {} >> newFileName
2.比较两个文件的区别
diff
的不加参数的基本命令最常用。
diff file1 file2