biopython - 比较两个序列的相似性
时间:2022-07-23
本文章向大家介绍biopython - 比较两个序列的相似性,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
比较序列相似性(sequence similarity)可以考虑用biopython或者emboss的几种比对方法。
1. Bio.pairwise2
主要用到SeqIO.parse读取,然后用Bio.pairwise2.align.globalxx比对并输出两个序列一样的比例。 如果用局部比对,可以用Bio.pairwise2.align.localxx.
from __future__ import division
from Bio import pairwise2 as pw2
from Bio import SeqIO
first_dict = SeqIO.to_dict(SeqIO.parse(open(first_fasta),'fasta')) # 直接转为字典格式
second_dict = SeqIO.to_dict(SeqIO.parse(open(second_fasta),'fasta'))
# 两个fasta文件中的序列两两比较:
for t in first_dict:
t_len = len(first_dict[t].seq)
for t2 in correspond[t]:
global_align = pw2.align.globalxx(first_dict[t].seq, second_dict[t2].seq)
matched = global_align[0][2]
percent_match = (matched / t_len) * 100
print(t + 't' + t2 + 't' + str(percent_match) + 'n')
2. Bio.Emboss.Applications
用了NeedleCommandline去比对,实测比上面的方法要快一点。不过都是python写的,又是基于DP,都不算很快。
from Bio.Emboss.Applications import NeedleCommandline
needle_cline = NeedleCommandline(asequence="test1.txt", bsequence="test2.txt",gapopen=10,gapextend=0.5,outfile='stdout')
out_data, err = needle_cline()
out_split = out_data.split("n")
p = re.compile(": (.*)/")
print(int(p.search(out_split[24]).group(1).replace("%", "")))
3. needle
本质与上面的方法一样,不过这个是在shell中运行的。
# 安装
conda install -c bioconda emboss
# 运行
needle -asequence test1.txt -bsequence test2.txt -gapopen 10 -gapextend 0.5 -outfile aln.needle
grep 'Similarity' aln.needle | awk -F '[:| |/]' '{print $4}'
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法