Overview 在 BioPerl(一):安装BioPerl 中我们不只安装了BioPerl,还给出了一个使用BioPerl的手动构造了一个Bio::Seq对象的例子,这个对象中包含了我们手动填入的fasta格式的信息。既然可以手动构造,那么也就可以从fasta文件中读取序列信息,由BioPerl自动填充成Bio::Seq对象。 1. 使用BioPerl读取单条fasta序列 我们有一个...阅读全文>>
BioPerl(一):安装BioPerl
Overview 今天闲暇之余,看到了一篇关于BioPerl的博客 初品BioPerl(第三篇:从本地文件中获取fasta序列),发现BioPerl可以让很多事变得简单,fasta格式处理起来也事半功倍。 其实宋老师之前已经跟我提过BioPerl了,只不过我一直以任务为导向,觉得perl脚本就够处理,所以一直也没去了解。好东西自然马上就要用起来,我也马上装上了BioPerl,这里记录下来B...阅读全文>>
部署PhosphoPrediction
Overview 因为投稿论文的需要,我们要把PhosphoPrediction部署到Monash的云服务器(Ubuntu 14.04.3 LTS (GNU/Linux 3.13.0-74-generic x86_64))上,在宋老师申请了云服务器之后,Jerico帮忙搭建好了云服务器,帮我们装好了JDK1.8,并给了我访问权限,在部署的过程中遇到了一些问题,在这里记录一下。 1. ssh...阅读全文>>
Javamail应用
Overview 本文主要参考了javamail发送邮件的简单实例这篇文章。 最近和Chris在做secretepdb这个项目时,用到了发送邮件这一功能(需要用到mail.jar这个包)。经过Chris指点和自己查阅资料,还是比较顺利地完成了这一模块,特此记录一下。 该模块包含3部分:发送器(SimpleMailSender),验证器(MyAuthenticator)和action。其中发...阅读全文>>
PhosphoPrediction项目总结
Overview PhosphoPrediction项目是Chris和我做的一个新项目,主要是为本地客户端程序添加一个相同功能的web server。由于出差新疆,只能晚上回酒店自己加班写代码,在Chris的帮助下,前前后后忙了大约两周总算有了个不错的小成果,心中颇感欣慰。这段时间,Chris不仅给了我技术上的指导,更给我排解了心中的许多烦恼,在此感谢我最好的朋友Chris(我知道你不喜欢...阅读全文>>
蛋白质序列特征提取方法之——PSSM
Overview 我在之前写的一篇博客中谈到整理那些混乱的数据源,发现有pssm fts文件夹中的子文件夹和文件并不清楚来龙去脉,这个问题困扰了我一段时间。最近在研究PSSM算法时,与Chris交流了一下,恍然大悟:这个文件夹中的t3pssm,t4pssm,t6pssm三个子文件夹中的形如t6_12.pssm的文件族,是由t3,t4,t6这三个文件夹中的形如t6_12.fasta的文件族经...阅读全文>>
一种基于点互信息熵的特征提取算法
Overview 最近看了几种生物信息学领域的特征提取算法,在观察了已有算法的特点之后,也想尝试着设计新的算法。这里以CKSAAP为基础,介绍一下我们想设计的算法的动机和原理。 CKSAAP的核心原理 关于CKSAAP的算法介绍详细部分可以参考Young写的 蛋白质序列特征提取方法之——CKSAAP。 CKSAAP试图统计刻画出每条序列中不同的氨基酸对出现的特征,它的核心原理可以用下面这个公...阅读全文>>
蛋白质序列特征提取方法之——CKSAAP
Overview 在CKSAAP(Compositon of k-spaced Amino Acid Pairs)方法中,利用在蛋白质序列片断中k个间隔距离的残基对(residue pairs)在该序列中的组成比例,建立数学模型,提取出特征向量,从而达到预测泛素(Ubiquitin)的目的。 残基(residue)和泛素(Ubiquitin)信息详见维基百科:残基和泛素,这里就不赘述了。 ...阅读全文>>
生物化学基础知识简介
蛋白质序列处理过程中需要用到部分生物化学的知识,经过Chris的点拨和自己的查阅,现将这些基础知识记录下来。 阅读全文>>