云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > RepeatMasker网页版和命令行版使用说明(中文翻译版)

RepeatMasker网页版和命令行版使用说明(中文翻译版)

  • 62 次阅读
  • 3 次下载
  • 2025/5/31 12:07:48

1 / 12

RepeatMasker网页版和命令行版使用说明(中文翻译版)

引用自Tarailo-Graovac M, Chen N. Using RepeatMasker to identify repetitive elements in genomic sequences. CurrProtoc Bioinformatics. 2009 Mar;Chapter 4:Unit 4.10.doi: 10.1002/0471250953.bi0410s25.

RepeatMasker是一款广泛应用于基因鉴定、分类和mask repetitive elements,包括低复杂度序列和散布重复序列。RepeatMasker通过将数据库如:Repbase中已知的重复序列与输入的基因组序列比对来搜素重复序列。在此我们描述两个基础协议,它对如何运用RepeatMasker去分析基因组序列的重复元件提供细节上的指导,而不论是通过网络界面还是通过Unix/Linux命令系统。在RepeatMasker中的序列比较通常经过cross-match程序的序列比对来实现,对于较大序列这一过程需要大量处理时间。交替协议描述的是通过应用诸如WU-BLAST这样的选择性比对程序来怎样减少处理时间。而且RepeatMasker的优势、局限和已被发现的漏洞将在此进行讨论,最后提供理解其处理结果的指南。

在新的RepeatMasker程序包中添加了鉴定蛋白质序列的重复原件的程序。

要运行RepeatMasker,首先要选择重复库文件(repeat library files),这一文件包含重复元件共有序列。目前,Repbase Update是最大的商业性(商购)重复库(free for academic use)并且包含了相当数量的包括人、啮齿动物、斑马鱼、果蝇以及拟南芥在内的生物体。生物体的库文件中没有Repbase Update时,库文件会用RECON(Bao and Eddy, 2002;

http://selab.janelia.org/recon.html)

RECON 的

v.1.06列

较已常

经通

发过

且Green

可改

以进

或从的

RepeatScout(http://bix.ucsd.edu/repeatscout/; Price et al., 2005)从头产生。最新

http://www.repeatmasker.org/RepeatModeler.html.中获得RepeatModeler程序包。

RepeatMasker

Phil

cross-match(http://www.phrap.org/consed/consed.html#howToGet)来实现,另外也可以为了快速程序来用WU-BLAST(http://info.cchmc.org/help/wublast.html; see Alternate Protocol)来代替cross-match。

一、通过网络界面运用RepeatMasker

RepeatMasker可通过http://www.repeatmasker.org/cgibin/WEBRepeatMasker来获得,它不像命令行版本的RepeatMasker,网络版RepeatMasker的核苷酸序列长度限制在100kb,不能分析长度超过100kb的序列(提示会在窗口中显示)。短于100kb的序列可以用网络版RepeatMasker来分析,其花费的时间与序列的长度相关。对于北美以外的快速服务有在德国、以色列和澳大利亚的RepeatMasker镜像网站。另外,如果常规分析大片段序列,最好是下载并本地运行命令行版本。重要的是,如果需分析的序列超过100kb,唯一的选择就是下载RepeatMasker并在本地运行。

必需资源

硬件:任意一台联网的计算机。

软件:浏览器 如IE或火狐浏览器

文件:FASTA文件或能通过网络界面处理的收集的FASTA文件。

2 / 12

1.点击网页浏览器,进入http://www.repeatmasker.org/cgi-bin/WEBRepeatMasker.通过序列名或浏览文件下载FASTA序列文件(最大100kb),或者粘贴FASTA序列(最大100kb)到指定的文本框。

如果输入的序列包含非DNA符号或者序列太长,RepeatMasker会提示错误信息。

2. 从单选框下的“return format”来选择结果的格式:“html”或“tar file”。 如果选择“html”,那么结果会以一个超文本标记语言(html.)文件输出。如果选择“tar file”,那么结果会打包为用Unix系统“tar”协议的文档。

3. 从“return method”下两个单选按钮选择会送结果的方法,即:“html”或“email”。

如果选择这一步和上述第2步都选择“html”,那么所有的结果会通过窗口显示,如果过这步选择“html”,而第2步却选择“tar file”,那么结果会在窗口内提供链接。如果选择“email”,那么需要填写电子邮件地址,以确保结果可以通过电子邮件发送。这里以“html”为例。

4.目前,可以选择点击提交序列的按钮来运行RepeatMasker,同时可选择其他选项来设置默认值。如果系统默认值不能满足需要,可继续第5到8步并按第9步提交序列。

设置其他选项设置默认值后点击提交序列,结果会在窗口中展示,如图4.10.2,4.10.3,4.10.4和4.10.5.为理解结果的细节可以看参考。

3 / 12

4 / 12

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

1 / 12 RepeatMasker网页版和命令行版使用说明(中文翻译版) 引用自Tarailo-Graovac M, Chen N. Using RepeatMasker to identify repetitive elements in genomic sequences. CurrProtoc Bioinformatics. 2009 Mar;Chapter 4:Unit 4.10.doi: 10.1002/0471250953.bi0410s25. RepeatMasker是一款广泛应用于基因鉴定、分类和mask repetitive elements,包括低复杂度序列和散布重复序列。RepeatMasker通过将数据库如:Repbase中已知的重复序列与输入的基因组序列比对来搜素重复序列。在此我们描述两个基础

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com