您正在查看: 2015年10月

使用Apache反向代理转发Tomcat请求

Overview 最近在为我们的一篇论文做Online Server,我们使用了Java的Struts框架搭建了Server,并且部署到了Tomcat上,这也带来了一个问题。服务器上本来已经有了Apache,并且占用了80端口,加上Tomcat之后使用域名必须加上Tomcat的端口号访问,使用起来很不方便,Online Server的网址看起来也很奇怪。 整合Apache和Tomcat有好...阅读全文>>

蛋白质序列特征提取方法之——PSSM

Overview 我在之前写的一篇博客中谈到整理那些混乱的数据源,发现有pssm fts文件夹中的子文件夹和文件并不清楚来龙去脉,这个问题困扰了我一段时间。最近在研究PSSM算法时,与Chris交流了一下,恍然大悟:这个文件夹中的t3pssm,t4pssm,t6pssm三个子文件夹中的形如t6_12.pssm的文件族,是由t3,t4,t6这三个文件夹中的形如t6_12.fasta的文件族经...阅读全文>>

构建PSSM的步骤

Overview PSSM算法是生物信息学领域中的一个常用算法,全名“位置特异性打分矩阵(position-specific scoring matrix)”,又称作"位置比重矩阵(position weight matrix)".有关该方法更多的细节,详见维基百科Position weight matrix.本文仅阐述其设计思想,实际项目的例子将在另一篇文章中进行介绍...阅读全文>>

一种基于点互信息熵的特征提取算法

Overview 最近看了几种生物信息学领域的特征提取算法,在观察了已有算法的特点之后,也想尝试着设计新的算法。这里以CKSAAP为基础,介绍一下我们想设计的算法的动机和原理。 CKSAAP的核心原理 关于CKSAAP的算法介绍详细部分可以参考Young写的 蛋白质序列特征提取方法之——CKSAAP。 CKSAAP试图统计刻画出每条序列中不同的氨基酸对出现的特征,它的核心原理可以用下面这个公...阅读全文>>

蛋白质序列特征提取方法之——CKSAAP

Overview 在CKSAAP(Compositon of k-spaced Amino Acid Pairs)方法中,利用在蛋白质序列片断中k个间隔距离的残基对(residue pairs)在该序列中的组成比例,建立数学模型,提取出特征向量,从而达到预测泛素(Ubiquitin)的目的。 残基(residue)和泛素(Ubiquitin)信息详见维基百科:残基和泛素,这里就不赘述了。 ...阅读全文>>

生物化学基础知识简介

蛋白质序列处理过程中需要用到部分生物化学的知识,经过Chris的点拨和自己的查阅,现将这些基础知识记录下来。 阅读全文>>

将台式机上的NDNSIM1.0(包含实验脚本和转发策略代码)移植到Mac上的问题

Overview 这篇文章是我很久之前移植NDNSIM1.0时的笔记,最早想从台式机的Ubuntu 12.04上移植到别的机器的Ubuntu上,都会出现各种编译问题,一直没能成功,之后想在Mac上做实验,所以下决心把台式机中的NDNSIM 1.0的源代码移植到Mac上,主要遇到了以下问题,做了一下记录,以备以后查看。这个移植应该不只是移植到Mac上的方法,而是适用所有Ubuntu系统的。 ...阅读全文>>

Typecho文章评论时评论者头像引发的性能问题

Overview 最近在阅读博客中的文章时发现一个奇怪的现象,就是有评论的文章加载速度特别慢,代码块的颜色渲染也要等很久才能显示出来。这让我很困惑,因为我将代码块高亮渲染的代码也放在了本地。最初我以为是代码块中的代码太多,导致渲染时间久。后来发现只有有评论的文章才会出现这种情况,使用了Chrome发现,有评论的页面会出现http://www.gravatar.com/avatar/####...阅读全文>>

Typecho博客的速度优化

Overview 由于在写笔记的时候会用到公式,因此使用了一个插件MathJax,可以很漂亮显示公式,但是发现用了这个插件之后,有公式显示的页面加载特别慢,使用Chrome查看了链接请求,发现了问题所在:这个插件会请求 cdn.mathjax.com 上的js代码,而 cdn.mathjax.com 的服务器非常不稳定,因此经常需要等待很久,网页才能正常显示。 好在因为Chrome会缓存j...阅读全文>>