“ 辛克莱,当您忽然想到一些疯狂或邪恶的念头,想要把某人给杀了,或者想要犯下罪大恶极的罪行,这时您要想一想,那是阿布拉克萨斯在您内心制造的幻想!您想要杀害的绝不是一个真实的人,肯定只是一个伪装而已。假如我们怨恨一个人,我们恨的是在他形象中的某些东西,这些东西也是我们本身所拥有的。凡是我们本身没有的东西,并不能激动我们的心。” 今天是中秋节,跟我爸爸聊天时,他顺便转...阅读全文>>
“ 辛克莱,当您忽然想到一些疯狂或邪恶的念头,想要把某人给杀了,或者想要犯下罪大恶极的罪行,这时您要想一想,那是阿布拉克萨斯在您内心制造的幻想!您想要杀害的绝不是一个真实的人,肯定只是一个伪装而已。假如我们怨恨一个人,我们恨的是在他形象中的某些东西,这些东西也是我们本身所拥有的。凡是我们本身没有的东西,并不能激动我们的心。” 今天是中秋节,跟我爸爸聊天时,他顺便转...阅读全文>>
Overview DISOPRED是一个蛋白质内部非结构区域的预测软件,使用DISOPRED,我们可以很方便地得到一个蛋白质序列的非结构区域信息,能够为蛋白质特征分析提供更多的信息。 1.DISOPRED的下载 去http://bioinfadmin.cs.ucl.ac.uk/downloads/DISOPRED/这里就可以下载各个版本的DISOPRED,这里我们下载最新版本的DISOPR...阅读全文>>
Overview 在读论文或者写作的过程中,免不了有大量的公式推导,因此需要在博客里添加对LaTeX公式的支持。 我们找到了一个支持typecho博客的插件MathJax,下载地址和对这个插件的使用说明都可以参考原作者的博客:MathJax 插件。 1.插件的安装 和所有其他typecho博客的插件一样,将下载下来的MathJax解压缩后,上传到你的blog目录的usr/plugins中即...阅读全文>>
蛋白质序列处理程序之前得到的数据源太乱,这些天整理并重新摆放了一下,每一步的输入文件夹后缀都有一个-in,处理程序文件夹后缀为-run,输出文件夹后缀为-out,这样条理清晰了很多,今日记录,以方便日后查阅使用。 数据处理部分共分5步: 下载并分类(set class) 多步CD-hit 正负样本1:1平衡(Dataset balance) 特征计算(feature calculation...阅读全文>>
该步骤为数据处理的第(4)步,共包含6小步。 其中前三步: 1. AAC,Amino acid composition(AminoAcidC.py) 2. SEQ,Sequence(Seq.py) 3. eft3,amino acids combination properties(involving kmp algorithm)(Eft3.py) 这前三步用到feature_calc.s...阅读全文>>
Overview 在对氨基酸序列进行机器学习建模时,需要对氨基酸序列做特征提取,越丰富的特征通常可以带来越精准的预测结果,因此可以由原始的氨基酸序列预测出蛋白质的2级结构,水溶性等,丰富特征提取时的特征。 SCRATCH作为UCI开发的一个套件包,提供了多种不同的蛋白质预测功能,这些预测器被打包成一个集成的套件安装包SCRATCH-1D (SCRATCH Suite of One-Dime...阅读全文>>
Overview 在对氨基酸序列进行机器学习建模时,需要对氨基酸序列做特征提取,越丰富的特征通常可以带来越精准的预测结果,因此可以由原始的氨基酸序列预测出蛋白质的2级结构,水溶性等,丰富特征提取时的特征。 PSIPRED作为一个常用的蛋白质二级结构预测工具,常见于各种蛋白质序列的预测论文中,这里主要记录一下PSIPRED的安装和使用。 其实PSIPRED官方的README文档已经很清楚了...阅读全文>>
Overview 最近需要用到数个Python程序处理蛋白质序列以输出特征值,而这些Python文件需要在Shell脚本中传入文本文件(该文本文件记录了某些蛋白质序列)做参数,进而依次被Shell调用。我们在Java程序中建立Shell脚本的运行时环境Runtime,这其中用到了一个类,即java.lang.Runtime,下面对该类进行探讨和记录。 1.直接运行Shell命令 java....阅读全文>>
Overview Weka is easy to use when we do feature selection and classification. Using Weka's friendly graphic user interface, we can try and validate multiple feature selection methods and classifie...阅读全文>>