Sequence Analysis Software for Macintosh and Windows
GETTING STARTED
Introductory Tour of the LASERGENE System MAY 2001
DNASTAR, Inc. 1228 South Park Street Madison, Wisconsin 53715 (608) 258-7420
Copyright . 2001 by DNASTAR, Inc.
All rights reserved. Reproduction, adaptation, or translation without prior written permission is prohibited,except as allowed under the copyright laws or with the permission of DNASTAR, Inc.
Sixth Edition, May 2001
Printed in Madison, Wisconsin, USA
Trademark Information
DNASTAR, Lasergene, Lasergene99, SeqEasy, SeqMan, SeqMan II, EditSeq, MegAlign, GeneMan, Protean,MapDraw, PrimerSelect, GeneQuest, GeneFont , and the Method Curtain are trademarks or registered trademarks of DNASTAR, Inc. Macintosh is a trademark of Apple Computers, Inc. Windows is a trademark of Microsoft Corp. ABI Prismare registered trademarks of Pharmacopeia, Inc.
Disclaimer & Liability
DNASTAR, Inc. makes no warranties, expressed or implied, including without limitation the implied warranties of merchantability and fitness for a particular purpose, regarding the software.
DNASTAR does not warrant, guaranty, or make any representation regarding the use or the results of the use of the software in terms of correctness, accuracy, reliability, currentness, or otherwise. The entire risk as to the results and
performance of the software is assumed by you. The exclusion of implied warranties is not permitted by some states. The above exclusion may not apply to you.
In no event will DNASTAR, Inc. and their directors, officers, employees, or agents (collectively DNASTAR) be liable to you for any consequential, incidental or indirect damages (including damages for loss of business profits, business interruption, loss of business information and the like) arising out of the use of, or the inability to use the software even if DNASTAR Inc. has been advised of the possibility of such damages.
Because some states do not allow the exclusion or limitation of liability for consequential or incidental damages, the above limitations may not apply to you.
DNASTAR, Inc. reserves the right to revise this publication and to make changes to it from time to time without obligation of DNASTAR, Inc. to notify any person or organization of such revision or changes. The screen and other illustrations in this publication are meant to be representative of those that appear on your monitor or printer.
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 2 -
目录
在苹果机(Macintosh)上的安装与升级 05
通过因特网升级 06 软件安装 网络安装 疑难解答 12
在PC机(Windows)上安装与升级
通过因特网升级 软件安装
从 EditSeq 开始 21 从 GeneQuest 开始 31 从 MapDraw 开始 44 从 MegAlign 开始 54 从 PrimerSelect开始 65 从 Protean 开始 78 从 SeqMan II 开始 89
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
07 08 17 18
- 3 -
19
L A S E R G E N E
f o r
Wi n d o w s & M a c i n t o s h
DNASTA R I n c . ( 6 0 8 ) 2 5 8 - 7 4 2 0 f a x : ( 6 0 8 ) 2 5 8 - 7 4 3 9 e m a i l : s u p p o r t @ d n a s t a r. c o m
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 4 -
在苹果机(Macintosh)上的安装与升级 通过因特网升级
必备条件 6 下载升级程序 6
软件安装
必备条件 7 从CD安装Lasergene 7
网络安装
必备条件 8 定义 8
Dongle安装 10
服务器安装 10 终端机安装 11
疑难解答
系统配臵冲突及网络问题 12 解决网络问题的其他工具 13 授权错误报告 14 程序使用及更多的授权信息 15
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 5 -
通过英特网升级
如果您以前已经安装了Lasergene 而且目前有升级和服务联系,您就可以通过英特网来升级您现有的版本,各种模块(module)都是以自解压形式存储的,你可以选择性的下载安装。
必备条件
您的用户名和会员号是必需的,可以在安装盘上找到。
程序升级
备份您已有的Lasergene,找到您要升级的程序,并把它转移到备份的文件夹中。连接到DNAstar网站的主页(http://www.dnastar.com),从菜单中的Customers中点击Lasergene Updates点,安提示输入密码和用户名(与会员名相同),这样就会打开下载页面,找到Macintosh软件(Macintosh Software),就可以下载您想要的模块了。 模块下载完毕以后,双击文件将其解压缩到已经安装的DNAstar文件夹中替换旧的模块文件。
用Macintosh Finder打开Lasergene浏览器,找到DNAstar文件夹,从FILE MENU选择Update Applications,然后插入安装盘,等待升级完毕。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 6 -
软件安装 本节介绍若何从CD在苹果机(Macintosh)上安装Lasergene。注意安装是尽量关闭所有其它程序以保证安装顺利进行。 必备条件
一张个人的Lasergene安装盘; 一张Lasergene软件光碟;
足够的硬盘空间和内存:至少30Mb的硬盘,32Mb的RAM。
从光盘安装Lasergene
插入安装盘和安装光盘,双击图标,续则出现安装窗口。 窗口中有两种安装选择:简易安装和一般安装。 简易安装可以运行于68K-family and Power Macintoshes。
而一般安装可以安装工作站文件、执行文件和样品资料,我们推荐使用简易安装,如果使用一般安装可以节省5Mb的空间。 注意安装完毕后,要重新启动计算机。
则出现下面的窗口,点击继
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 7 -
网络安装 Lasergene网络系统是可以运行于局域网计算机上的软件。他有两部
分组成:一是资料服务器,服务器要有较大的硬盘和较高的运行速度;二是与服务器相连的终端机。后者通过一个称为dongle的
Lasergene硬盘设备相连进行管理。
必备条件
安装磁盘(服务器版)
客户端磁盘,包括安装盘(终端版)和Disk 1(终端版)。
Lasergene软件光盘
DNAstar网络用dongle
盘足够的硬盘空间和内存:服务器至少30Mb的硬盘,8Mb的RAM。终端机至少1Mb的硬盘,32Mb的RAM。
定义
在安装Lasergene网络系统之前要熟悉以下术语:
? 应用程序:指EditSeq, GeneMan, GeneQuest, MapDraw,
MegAlign, PrimerSelect, Protean, and SeqMan II。 ? 应用程序服务器:是指存储应用程序的电脑,通常与dongle服务
器是同一个服务器,但也可以不同,当在局部硬盘上安装网络程序时,也可以在同一个网络系统中同时存在多个不同的应用程序服务器,而且应用程序服务器不一定是苹果机,储存应用程序的机器也
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 8 -
不一定必须能够运行该程序,仅仅是储存而已。
? 终端机安装(又称工作站安装),安装网络版本Lasergene运行的最
小软件部分,它包括以下在内:LicenseKeeper,Navigator,和系统资源。
? 终端机:这可以是任何不作为Dongle Server的网络上的机器。终端
机是任何最少穿过终端机安装的机器,这样是使得Lasergene应用程序运行需要的最少、最低限度的软件。
? Dongle:Dongle是网络版Lasergene需要的硬件装臵。每个网络系统
都需要单独的Dongle。dongle是末端上带1个短的电缆的小的矩形的装臵。有2不同的种类的dongles:一种是在计算机背后可与调制解调器端口连起来,有9个pin插头;另一种有4个别针阳插头,连接鼠标和键盘。
? Dongle服务器:这是装有Dongle的机器,它肯定是最少穿过终端机
安装的苹果计算机,这机器应该始终保持运行。
? Navigator:是为了更简单的进行Lasergene应用设计的工具。在必
要的情况下,Navigator将自动安装网络组件,而且为网络安装诊断工具。
? LicenseKeeper:和Dongle交流的持有人的系统扩展部分。它告诉
dongle哪个应用被开始,这样,dongle才允许末个机器程序运行。 ? 服务器安装: 指Lasergene软件的完整安装,包括应用程序、
LicenseKeeper、Navigator和系统资源。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 9 -
Dongle安装
使Lasergene网络版能够运行的第一个操作就是安装dongle。在你安装之前,请检查你的dongle是否有9-别针连接器(connector)或4-别针连接器(connector)。
? 关闭你打算装dongle服务器那台苹果计算机的电源。
? 如果你的dongle有9-别针连接器(connector),把它连接到你的计
算机调制解调器的端口上。调制解调器端口是一个有9个外臵接口的设备,位于你的苹果计算机的后面的展示板上,电话听筒图标的附近。
? 如果你的dongle有4-别针连接器,从键盘断开鼠标,把dongle接在
键盘上,接着,把你的鼠标接在dongle上。 ? 重新启动苹果计算机。
? 如果你的dongle被接在苹果计算机上,你必须按照dongle服务器那
样进行软件安装。如果你打算将这机器作为文件服务器,请安服务器安装的方法安装。如果你不打算将这机器作为文件服务器,请安终端机安装的方法安装。在对dongle服务器施行成功的软件安装之后,在启动时应该出现右面的服务器图标。
服务器安装(Server Installation)
? 这个安装和在第5页上所描述的软件安装过程基本相同的。由于大部
分的网络包括机器很多的不同的种类的(68 K,和Power Macintosh机器),所以我们推荐您选择简易安装。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 10 -
? 在完成软件安装之后,如右图操作共
享Lasergene应用程序文件夹,这样,其他的网络用户才可以使用。如果你不能确定怎样操作,请和你的网络管理员联络。
终端机安装(Client Installation)
? 终端机安装必须在全部需要对Lasergene服务器操作的机器,但不是
文件服务器的机器。
? 插入安装磁盘终端机版本,然后按照在第5页上软件安装的方法安
装。
? 随后通过苹果机菜单的选择命令将文件服务器和终端机相连。一些
网络可以使用其他的方法进行相连。如果这步你有问题,请和你的网络管理员联络。
? 从终端机上的DNASTAR文件夹中运行浏览器。
? 从文件菜单,选择寻找应用程序,你应该收到如下信息:全部应程
序用都被浏览器找到了。
现在就可以从文件服务器运行Lasergene应用程序了。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 11 -
疑难解答 系统配臵冲突
一些系统配臵可能会在安装过程冲突,如果你不能从Lasergene光盘成功地安装,可以关上不必要的配臵:
? 用计算机控制板上的配臵管理器关闭任何不必要的扩展程序。 ? 或重新启动你的机器,继续安装。
网络疑难
找不到dongle服务器是网络问题中最常见的问题。当你开始运行DNASTAR应用程序时,你会遇到这问题,提示信息显示:DNASTAR许可服务器没有应答,请再试一次。可能有以下几个原因:
? 是否装有dongle的计算机被关闭,如果是重启dongle机器即可。 ? 是否dongle没有接在苹果计算机上,或者不在调制解调器端口或鼠
标接口,按照第8页Dongle Installation命令在苹果计算机上重新安装dongle。记住在除掉或者插入dongle之前先关闭计算机。 ? 如果你的dongle被接在IIfx,Quadra 900或Quadra 950等机子上,
你不仅需要重新安装,还要进行如下操作: ? 从菜单中选择Control Panels中的Serial
Switch双击,就会出现右面的窗口。 ? 将Faster 换成Compatible。然后重启计算
机。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 12 -
? 如果dongle已适当地被接在调制解调器端口上,但是计算机不识别,
那可能是你的计算机在 booting 期间里不是别调制解调器端口的记号。用LicenseKeeper按下面的方法寻找调制解调器端口: ? 启动Navigator。
? 按Option——NETWORK MENU—
—Set LicenseKeeper的顺序打开右边的LicenseKeeper对话框。
? 把Dongle Delay参数放到3秒上。 ? 单击LicenseKeeper,接着Done。 ? 重启苹果计算机。
? 如果问题还没解决,和DNASTAR联络。
其他解决网络问题方法
要了解您的计算机和全部可通过网络运行DNASTAR的 dongle服务器,选择NETWORK MENU中的Diagnose LicenseKeeper。计算机将告诉您是否dongle被安装到你的计算机上,是否存在
LicenseKeeper系统配臵。同时显示LicenseKeeper站点识别和版本编号。无论你的计算机的授权状态如何,
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 13 -
Navigator都会报告所有已连接的dongle服务器的状态。许可服务器报告在网络地带附近形成,可显示全部对你的网络应答的dongle服务器的用户名,站点识别和版本编号。通常,你的LAN包括单一的dongle服务器,但是,大的网络上可以有几个。如果你的计算机被接在大的LAN上,打开这个报告可能会慢一些。确定全部LicenseKeeper服务器的地点要求network request被送到在LAN上每个区。至少需要1秒钟才能确定是否有回应。
LicenseKeeper错误报告
如果授权系统没有安装,或者和dongle服务器连接困难,Navigator将会发现问题,报告错误信息。下面斜体为错误类型,其后是各自的原因。 ? LicenseKeeper系统扩展没在系统文件夹或扩展文件夹中。重新安装Lasergene客户端软件。Navigator不能和系统扩展连接,也没在系
统文件夹中发现。对于System 7或较晚的Macintoshes,如果你重启计算机时按下Shift键,则可能发生这问题。
? 当计算机起动的时候,按下了鼠标按钮或Shift键。重启你的机器。
因为系统扩展在启动时被失活了,所以Navigator不能和系统扩展交流。
你的机器上安装了较老版本的Mac机网络协议。安装53或更新版本的Mac机网络协议。安装的Mac机网络协议不支持系统扩展。在小的网络或
closely-knit的安装上,这将不是问题,因为dongle服务器与其他的客户机在同一个区。如果必要,DNASTAR能为较新版本的Mac机网络协议
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 14 -
(AppleTalk)提供驱动和installation script。
? 不能在网上注册LicenseKeeper。和DNASTAR联络。由于你的计算机
上有太多的其他的网络处理,系统扩展不能进行网络操作。这种情况很少见,但如果您的计算机是网络中介的话,有时也会发生。 ? LicenseKeeper系统扩展所需的内存不够。关闭不必要的系统扩展。如果你的操作系统在你的计算机上使用了全部的内存,这也会发生。。
? 系统文件夹被保护。去除系统文件夹保护,重启计算机。系统文件
夹里的文件和已经使用的文件不能够保存。磁盘压缩和口令保护的扩展时会发生这些问题。
? 重新安装Lasergene工作站软件。系统扩展使用的系统文件夹里的文
件不存在了。
应用程序的使用
为了了解已连接的用户的数目,用户使用了什末程序,程序使用的时间,可以从NETWORK MENU打开Application Usage。窗口中还会显示有关诸如客户/服务器状态,站点识别和LicenseKeeper系统扩展的版本编号等一般信息。当这窗口打开时,Navigator将没10秒钟更新一次应用程序的使用信息。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 15 -
更多的LicenseKeeper信息
计算机启动时,LicenseKeeper将自动寻找网络的区信息和每个区的dongle服务器。只有标识号与LicenseKeeper系统扩展相符的dongle服务器才能够被识别。这允许1台以上dongle服务器在相同的网络的范围内操作。如果网络管理员改变了有dongle服务器的区名并重新启动dongle服务器,那末区外的所有终端机也必须重新启动。
系统扩展作为Dongle Server成功启动时,在启动期间会出现这个图标。
系统扩展作为终端机成功启动时,在启动期间会出现这个图标。 系统扩展被安装,但是由于较少的内存或失活(启动时按下了鼠标)而不能启动时会出现这个图标。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 16 -
WINDOWS上的安装与升级 通过因特网升级
必备条件 18 下载升级程序 18
软件安装
必备条件 19 从CD安装Lasergene
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h19
- 17 -
通过英特网升级
如果您以前已经安装了Lasergene 而且目前有升级和服务联系,您就可以通过英特网来升级您现有的版本,各种模块(module)都是以自解压形式存储的,你可以选择性的下载安装。
必备条件
您的用户名和会员号是必需的,可以在安装盘上找到。
程序升级
备份您已有的Lasergene,找到您要升级的执行程序,并把它转移到备份的文件夹中。
连接到DNAstar网站的主页(http://www.dnastar.com),从菜单中的Customers中点击Lasergene Updates点,安提示输入密码和用户名(与会员名相同),这样就会打开下载页面。
找到windows软件(Windows 95/98/NT Software.),就可以下载您想要的模块了。
模块下载完毕以后,双击文件将其解压缩完毕。
看到“Application name” has been updated.说明升级完毕。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 18 -
软件安装 本节介绍若何从CD在PC机(Windows)上安装Lasergene。注意安装是尽量关闭所有其它程序以保证安装顺利进行。 必备条件
一张个人的Lasergene安装盘; 一张Lasergene软件光碟;
足够的硬盘空间和内存:至少30Mb的硬盘,32Mb的RAM。
从光盘安装Lasergene
插入安装盘和安装光盘,双击安装图标,则出现下面的窗口,点击继续则出现安装窗口。
随后一次出现下面窗口,请按照提示做出选择然后点击Next,直至完成安装。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 19 -
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 20 -
从EditSeq开始 EditSeq是能够迅速、正确地输入,并且修改DNA或蛋白质序列工具。每个EditSeq文件都可以分为三个可编辑的部分,上边的一部分为序列文件,中间的一部分里是评论,底部是序列的注释。
EditSeq能读取大部分的序列格式——包括FASTA,GenBank,ABI、GCG和ASCII格式。你可以使用菜单命令或拖拽方式输入序列文件。另外, 序列也许通过使用键盘输入,或者从其他地方复制、粘贴得到。经Entrez或BLAST检索得到的序列可以直接从因特网或企业内部互联网服务器下载。
序列被打开后,EditSeq能使用标准或者指定的遗传密码进行翻译,或者反翻译,寻找开放读框,还可以进行阅读校对。另外, EditSeq能以GenBank,FASTA和GCG格式输出序列。
如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:support@dnastar.com,或者经http://www.dnastar.com.
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 21 -
内容 打开已有序列 23 寻找开放读框 24 DNA序列翻译 24 遗传密码选择使用 25 遗传密码修改 25 序列的反向互补及反向转换 26 BLAST检索 27 序列信息查看 28 序列校读 29 序列的保存与输出 29
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 22 -
打开已有序列
我们从用苹果计算机打开“TETHIS21MA”和用Windows打开“tethis21.seq”开始。
假设序列的末尾有载体序列污染。我们在用EditSeq打开序列的同时,用Set Ends命令去除5’和3’污染序列。 ? 从文件菜单(FILE MENU),选择Open。
? 打开文件夹“Demo Sequences”单击选定序列“TETHIS21”。 ? 单击位于对话框右下角的Set Ends按
钮。Set Ends被打开(如右)。 ? 在5’框和3’框中键入50和850,点
击OK。单击Open打开序列。
当EditSeq窗口打开时,序列长度显示在右上角。通过“setting ends,”现在你只有最初序列中的801 bp的片段。Set Ends选择在全部Lasergene应用程序中都可以使用。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 23 -
寻找开放读框
在这入门的一部分中,我们将确定序列中最大的ORF,并翻译它。 ? 从SEARCH MENU找到ORF,点
击打开会出现右边的对话框。 ? 单击Find Next寻找第一个
ORF的位臵。
? 继续点击Find Next直到你把ORF的位臵选定在位臵183-455。ORF
的坐标会出现在EditSeq窗口的顶端附近。
DNA序列翻译
这一节中我们介绍如何翻译我们的ORF,不过任何序列中的读框内部分都可以用下面的方法进行翻译。如果你的选择是在三联码的读框内,三
联码指示棒显示为实心黑线(如左图)。如果你的选择是不在三联码的读框内,左边的箭头和右面的箭头显示向左或向右移动一个bp,以使所选序列成为三的倍数。
? 选定ORF,从GOODIES MENU菜单中选
择翻译(Translate)。
? 翻译的蛋白质序列出现在一个新的未
命名窗口中(如右图)。它是使用标准的遗传密码翻译的。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 24 -
使用其它遗传密码
根据你的序列的来源,你可以选择使用非标准的遗传密码进行翻译等操作。在这节中,我们将标准的遗传密码转换成Ciliate Macronuclear密码 。
? 从GOODIES MENU菜单选择Genetic Codes
打开,子菜单显示如左。
? 单击“Ciliate Macronuclear”就实现了
遗传密码的转换,EditSeq现在使用的就是Ciliate Macronuclear的遗传密码。 ? 同样可以将遗传密码转换为其它类型。
遗传密码的编辑
这一节中我们修改Ciliate Macronuclear的遗传密码。 ? 从GOODIES MENU菜单选择Edit
Selected Code。这将打开右面的窗口,窗口显示遗传密码是怎样翻译DNA和RNA序列的。
? 如以DNA形式展示密码,点击DNA
按钮。
? 编辑时,单击任何要编辑的密码,
从其目前的位臵拖到新氨基酸对应的位臵则可。
? 如使用不同的启始密码子,单击Set Starts按钮。第二的遗传密码
窗就会被打开,可以进行起始密码子选择。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 25 -
? 单击任何氨基酸(或者codon位臵),该密码子就会变成绿色,而且
旁边出现一个箭头,它就被设定为起始密码子了。如要去除,只需单击它即可。如不保存,则单击取消;如要保存,单击保存为。
序列的反向互补及反向转换
下面的步骤可以用于反向测定的序列的正确输入。 ? 选定序列。
? 从GOODIES MENU菜单,选反向互补序列(Reverse Complement),
或者把序列颠倒过来(Reverse Sequence)命令,则被选定的序列就被翻转互补或翻转过来了。
BLAST检索
下面我们将在NCBI的BLAST服务器上对TETHIS21序列进行相似性比较。注意为了进行BLAST查找必须保证因特网的连接。如果你没有连接因特网,跳过这部分,继续下一部分。
? 选定序,或者从EDIT菜单中选择Select All。 ? 从网络检索菜单(NET SEARCH
MENU),选择BLAST查找。BLAST对话框就会出现。
? 程序默认为blastn,数据库默认是nr,参数转换请参照帮助。 ? 单击OK开始查找。 ? 寻找结果显示为两部
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 26 -
分(如下)。上边的部分是按可能性的顺序显示检索到的序列的名字,下面的部分显示上面部分选定序列与提交序列(上边序列)比较的具体结果。有关“score”和“expectation”的详细的信息在NCBI’s网点——http://www.ncbi.nlm.nih.gov/BLAST.——可以找到。一般来说,更主要的score和更低的expectation提示较好的相似性。
? BLAST结果窗最上边的3钮被用来打开,或者保存检索到的序列,
或者让你了解更多的有关信息。
下面我们从用“Create Document”钮来打开评分最高的5序列开始: ? 单击Create Document。一个小
的对话框出现。
? 在左上角有一个下拉菜单显示
默认(default)。单击下拉菜单,选顶端(Top)。并在右面的文本框中写入5。
? 单击OK,EditSeq自动查对多余序列。如果EditSeq提示至少2序
列是同一个,请点击OK。EditSeq将从因特网数据库下在单一的序列,并分别打开一个单独的EditSeq窗口。
下面我们用“Batch Save”钮将3-10序列保存为EditSeq文件: ? 选定从顶端起第3个序列。单击Batch Save。小的灰色的对话框出
现。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 27 -
? 单击下拉菜单,选Next。并在右面的文本框中写入8。 ? 点击Set Location,显示文件夹对话框。
? 选定你要保存序列的位臵。单击OK回到灰色的对话框。
? 单击OK保存序列,文件扩展为“.seq”。在下载过程期间,EditSeq
自动查对重复的序列。如果EditSeq提示至少2序列是同一个,请点击OK。
? 除非你收到错误信息,否则可以认为你的序列已经成功下载。
最后我们可以使用“Launch Browser”钮查看序列的详细信息 ? 选定序列。 ? 选
择
Launch
Browser。 ? 你的网络浏览器
将打开右面的窗口。
序列信息查看
现在我们要使用EditSeq菜单指令查看有关打开的TETHIS21序列的信息。
? 选定序列的一部分。如果你倒是
希望全选序列,从EDIT MENU菜单,选择Select All。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 28 -
? 从GOODIES MENU菜单,选DNA Statistics。就会出现右面的窗口,
显示序列信息。
序列校读
在我们学习保存和输出序列之前,下熟悉一下EditSeq的校读功能 这功能能帮助你校正测序胶中的错读。 ? 选定序列。
? 单击校对发音图标(序列窗口底部张开的嘴),或者从SPEECH MENU,
选Proof-Read Sequence。
? 电子的音声就会开始朗读所选的序列。(注:如果你听不见任何声
音,检查你的计算机的喇叭是否已经打开。)
? 要改变音声read-back的速度,从SPEECH MENU菜单,选择Faster or
Slower。
? 要停止校读,点击图标(手),或者从SPEECH MENU菜单,选择
Proof-Read Sequence。
序列的保存与输出
首先创建一个用于保存的序列。从文件菜单,选New中的New DNA,或者New Protein。
? 将序列写入出现的窗口。
? 如果你输入非法字符,计算机会发出警告。 然后,我们将序列保存为EditSeq文件:
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 29 -
? 从文件菜单,选Save。 ? 选定保存位臵。 ? 给序列命名。 ? 单击保存则可。
以GenBank或GCG格式保存序列: ? 从文件菜单,选Export。 ? 选定保存位臵。 ? 为sequence(s)选格式。 ? 给sequence(s)命名。 ? 单击保存则可。 以FASTA格式保存序列:
? 从文件菜单,选Export(1个序列),或者Export All As One(多
个序列)。当使用Export All As One的时候,如果DNA和蛋白质文件同时存在,激活窗口的序列类型与你保存的类型是一致的。EditSeq仅仅将写入的序列保存为FASTA格式。 ? 选定保存位臵。 ? 选FASTA格式。 ? 给sequence(s)命名。 ? 单击保存则可。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 30 -
从GeneQuest开始 GeneQuest可以帮助你发现和注释DNA序列中的基因,并帮助您操作生物学所关心的DNA的其他feature:包括ORFS、拼接点连接,转录因子结合为点、重复序列、限制性内且酶酶切位点等。通过应用“methods”到序列,序列的feature可以以图形的形式展示出来。你可以在序列上注释任何你发现的feature。和其它的Lasergene应用程序一样,GeneQuest也提供整合的BLAST和Entrez寻找功能。
GeneQuest能直接打开DNASTAR,ABI和GenBank文件。其他格式的序列文件也可以使用EditSeq改为DNASTAR格式。如果你知道Genbank序列的登录号或名称,你可以直接打开序列。另外,你还可以在Entrez数据库进行序列查找和输入。
如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:support@dnastar.com,或者经http://www.dnastar.com.
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 31 -
内容 打开已有分析文件 33 GeneQuest的DNA分析方法 34 用分析方法操作 35 方法参数改变 36 结果展示优化 37 Feature注释 38 BLAST检索 39 Entrez Database检索GeneQuest的其他特点保存分析文件 43
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 32 -
41 42 打开已有分析文件
在这一节中,我们将对已有的GeneQuest文件(也叫做GeneQuest分析)“Nematode R01H10.”进行操作。 ? 从文件菜单,选择Open打开一
个和右边相似的窗口。 ? 在苹果计算机上,从Show菜单
中选择GeneQuestDocument文件。在Windows上,从文件类型菜单(Files of Type)的中选择GeneQuest Documents。
? 用文件管理系统打开名为“Demo Sequences.”的文件夹。双击
Nematode R01H10,就可以打开下面的窗口。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 33 -
GeneQuest的DNA分析方法
打开GeneQuest文件后,下一步是选择应用方法。应用方法后,结果的图形显示可以帮助你了解序列上感兴趣的features。打开序列后,你会发现只有几种方法应用后的结果展示在窗口内。在下一部分中,我们将学习如何把其它方法用于我们序列的分析。 ? Title——给文件取名。 ? Ruler——在文件中加入标尺。 ? Sequence——显示文件中的序列。 ? Patterns-Matrix——方法的运算参数。 ? Patterns-Signal——转录因子结合位点数据库。
? Patterns-Type-In Patterns——使用键盘输入运算所需的Pattern参
数。
? Repeats-Inverted Repeats——寻找反向重复序列。 ? Repeats-Dyad Repeats——寻找Dyad重复和palindromes。 ? Repeats-Direct Repeats——寻找正向重复序列。
? Gene Finding - DNA Finder————在打开的DNA序列中寻找指定
DNA序列。分别显示正义连和反义连的寻找结果。
? Gene Finding - Protein Finder——在打开的蛋白质序列中寻找指定
DNA序列的翻译序列。显示结果为全部6个读框。
? Enzymes-Restriction Map——用DNASTAR酶目录中的酶分析打开
的序列,并以图形方式展示。
? Coding Prediction - Borodovsky——用Borodovsky’s Markov方法
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 34 -
来识别潜在的基因编码区,并以图形方式展示。
? Coding Prediction - Starts Stops ORFs——根据指定的ORFs的最小
长度,寻找可能的开放读框,可以选择是否需要起始密码子。读框的启始和中止点分别展示。
? Coding Prediction—Local Compositional Complexity——根据
Shannon信息学原理寻找有基因编码提示信息的区域。
? Base Contents-Base Distribution——序列上4种碱基、A+T和G+C的
频率、分布,以及AT和gc分布区域。
? Bent DNA - Bending Index——DNA折叠预测。
用分析方法操作
调用新的GeneQuest方法的步骤是:从More Methods中选择方法,加入方法帘(method curtain),待方法运行完毕后,选择性的拖取结果放入分析界面(assay surface)即可(见右图)。在本节中,我们使用Bent DNA - Bending Index方法进行分析。 ? 从
ANALYSIS
MENU选择Show Available Methods可以打开方法帘,也可以通过
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 35 -
拖动分析界面左上角的小环的打开方法帘。方法帘中包括已经用于分析的全部方法。
? 你将注意到方法帘没有Bent DNA - Bending Index method。在方法
帘的顶端,点击More Methods打开一个下拉菜单,其中尤可以用于分析的所有方法,点击Bent DNA - Bending Index method,该方法就进入了方法帘。
? 若查看方法帘中的方法是否已经被应用,点击其右边的三角形。如
果图标前有数字表明该方法已经使用,数字表示应用的次数。因为我们还没有应用Bent DNA - Bending Index,所以点击三角形,会发现图标前没有数字。
? 点击白颜色的位臵去除对图标的选择。 ? 单击选定“Bend Region,”,将其拖到分析
界面,释放鼠标。序列中可能会折叠的区域就会以小盒子的形式显示出来。
方法参数改变
下面我们改变方法的参数,然后将分析结果与参数改变前的结果进行比较。
? 重复前面的操作,在方法帘中加入一个新的Bent DNA - Bending
Index,并把它拖如分析界面。现在你应该有2个完全一样的折叠区分析结果。
? 双击方法帘中任何一个结果,将打开一个参数对话框。
? 改变弧长度参数为30,单击OK。分析界面上就会出现根据此参数计
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 36 -
算得到的结果。
(注:如果你再次拖入新的方法时,参数的改变会自动应用到新的方法上)。
结果展示优化
? 组合或移动展示的结果:单击位于GeneQuest窗口左侧的调色板工
具中的的选择器(手图标),在分析界面中可以随意拖动任何展示的结果到任何位臵。
? 改变方法格式:单击目的选择器(手图标),可以选择分析界面上
的任何方法。从OPTIONS MENU菜单选择Line Color,打开彩色选择子菜单。选定颜色后,方法题目和结果显示都将变成那个颜色。另外,你可以用类似的指令进行操作:Line Weight、 Fill Color and Fill Pattern。
? 去除方法:单击选择方法帘中显示的方法,用退位或删除键去除应
用的方法即可。
注意任何你除掉的方法都是能从Methods menu菜单再一次被使用。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 37 -
注释Features
当你用Genbank输入序列时,序列中标注的Features会自动转换为图形命令显示在方法帘中。这些Features 可以象任何别的方法那样拖到分析界面上显示。
GeneQuest也允许你为你的DNA序列制作新Features: ? 单击位于GeneQuest窗口的左侧的调色板工具(箭图标)。 ? 然后点击选定2641-4257的Informative Region。
? 点击调色板工具(铅笔图标),或者从SITES & FEATURES MENU
选择New Featur,打开一个Feature Editor对话框(如右图)
? 你打开Feature Editor时,
首先进入Location设定。点
击“Info region”进入Title box,点击“Segment A”进入Segment Name box,接着,在对话框的底部选择标题和区段名字的位臵。 ? 点击Description按钮进入新的Feature Editor窗口。如果你愿意,可
以在note中对Feature做标注,在key种选择Feature的种类。 ? 点击Style按钮进入最后的Feature Editor窗口,选择字型,大小和颜
色,以及你喜欢图型用于新建的feature。
? 点击OK关闭Feature Editor窗口。一个图形化展示的“Info region”
就会出现在分析窗口的底部。
下面我们把新建的feature与另外一个feature整合起来。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 38 -
? 单击调色板工具(箭图标)。选定你刚做好的feature,单击工具调
色板工具上的(链图标)。
? 然后点击名为“R01H10.4——CDS.”的feature,再点击连接(链图
标)。
? 这样你的“Info region”featur将继续作为没有联系的方法而存在,
但是,它的拷贝将作为R01H10.4featur的一部分出现。
BLAST检索
GeneQuest为你的序列在因特网或企业内部互联网数据库上进行相似性检索提供2不同的方法。BLAST Selection指令允许你使用序列的任何一部分进行检索。BLAST ORF需要你首先选择序列的ORF,然后他就可以自动翻译,在蛋白质数据库中进行检索。在这一节中,我们用BLAST在NCBI上检索与Nematode R01H10相似的序列。 注意必须保证您的计算机与因特网相连。否则,跳过这一部分。 ? 单击范围选择器调色板工具(箭图标)。
? 如同在右边被显示的那样,单击任何“R01H10.5”的feature。注意
此时选定的仅仅是外显子部分(exons),内含子部分被自动去除。 ? 从网络检索菜
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 39 -
单,选BLAST Selection。会出现左面的BLAST对话框。 ? 不做参数改变,这样,程序
是blastn,数据库是nr。 ? 单击同意开始查找。
寻找结果显示为两部分(如下)。上边的部分是按可能性的顺序显示检索到的序列的名字,下面的部分显示上面部分选定序列与提交序列(上边序列)比较的具体结果。有关\和\的详细的信息在NCBI's网点--http://www.ncbi.nlm.nih.gov/BLAST.--可以找到。一般来说,更主要的score和更低的expectation提示较好的相似性。BLAST结果窗最上边的4钮被用来打开,或者保存检索到的序列,或者让你了解更多的有关信息。“Put In Document”按钮相当于Gene Finding - DNA
Finder,在打开序列中寻找检索到的序列。(如果我们使用blastp或blastx,则相当于Gene Finding-Protein Finder) ? 在BLAST结果窗口中选择一个检索结果。 ? 单击Put In Document。保存对话窗将打开。 ? 选定保存位臵,并命名。单击保存。
? 你选的序列将象应用方法那样以短的垂直的竖线自动出现在分析界
面的底部。垂直的竖线显示BLAST结果的位臵。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 40 -
? 可以选择Zoom in/OUT来放大或缩小视野。直到你能清楚地查看序
列。
? 其他按钮与EditSeq中介绍的功能相同。
Entrez Database检索
GeneQuest允许你在因特网或企业内部互联网的Entez数据库上进行检索。检索到的结果可以输入GeneQuest(或者EditSeq),或者保存为序列文件。在这一节中,我们将检索与狨视觉色素(visual pigment in marmosets)序列有关的序列,然后学习GeneQuest或EditSeq是如何打开其中的一个序列的。
? 从网络检索菜单(NET SEARCH MENU),选择新正文查找(New
Text Search)来打开Entrez Query窗口(如右)。 ? 在文本框中敲入
“visual pigment.”。
? 从默认为“All Fields”的下拉菜单中选择“Text Word.”。 ? 用鼠标从右面再拖入一个检索框(New Term)。
? 在文本框中敲入“Callithrix”,从“New Fields”菜单中选“Organism”。 ? 单击查找。查找结果出现于Entrez Results窗口(如下)。 ? 双击任何Entrez Results窗口里的序列,就可以查看其详细信息。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 41 -
如果你想在GeneQuest或EditSeq里打开其中的一个序列: ? 从Entrez Results窗,单击你想打开的序列。
? 从网络检索菜单,选择用GeneQuest或者EditSeq打开(Open with
GeneQuest/Open with EditSeq)。
? 选定文件保存的位臵,并给文件取名。单击同意(视窗),或者保
存(苹果计算机)。
如果你选择以GeneQuest打开文件,GeneQuest将打开文件并且将其默认的方法自动应用到序列上。如果你做选择以EditSeq打开文件,Entrez序列将在主窗口中显示。
GeneQuest的其他特点
以RNA折叠形式查看序列的一部分:
? 选定目的序列,在ANALYSIS MENURNA菜单中选择Fold as RNA命令。 序列酶切,模仿agarose凝胶电泳判定大小: ? 打开方法帘(method curtain)。
? 从More Methods中选择Enzymes - Restriction Map 加入方法帘。 ? 单击图标左边的蓝色三角形,打开内切酶一览表。注意方法帘仅仅
显示那些最少切割一次DNA序列的酶。刚打开酶一览表时,所有的酶都被选中了,在空白处单击一下去除选定。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 42 -
? 选定特定的酶,拖入分析界面,即可
以看见该酶的酶切位点在序列上的位臵。
? 从SITES & FEATURES MENU菜单选泽
Agarose Gel Simulation。 ? 新窗口即显示酶切片段在
electrophoretic的分离情况(如图)。
保存分析文件
? 从文件菜单,选保存。
? 选定文件的保存位臵。给文件命名。 ? 单击保存。
? 你所应用和展示的所有信息都会被保存。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 43 -
从MapDraw开始 根据实验设计,分析和实验结果的展示需要的不同,MapDraw可以制作6种类的酶切图。从简单的线性图到有注释的环形图,在展示限制性酶切位点的同时,还可以同时展示序列的feature,六个读框及其翻译结果。MapDraw也以自动展示从GenBank输入序列的features。
你可以按照位臵、酶切频率等来排列你的酶切位点。另外, 你可以用手工选任何酶切位点的结合。酶切位点过泸器(filters)也可以使用Boolean operators联合使用。
MapDraw工具能使你规划酶切位点和克隆实验,产生详细,充分地结果概括。和全部Lasergene应用程序一样,MapDraw也提供整合的BLAST查找功能。
如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:support@dnastar.com,或者经http://www.dnastar.com.
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 44 -
内容 新酶切图制作 46 过泸器类型 47 应用频率过泸器 47 应用手动过泸器 48 使用过泸器一览表 49 使用Must Cut Here/Don’酶信息显示 51 环形展示 51 ORF图 52 显示择选 53 保存,退出 53
调色板工具 50 L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 45 -
t Cut Here 新酶切图制作
我们以组氨酸DNA序列“TETHIS21MA”(苹果计算机)和“tethis21.seq”(视窗)为例。首先我们寻找能够切割组氨酸DNA序列的酶切位点。 ? 从文件菜单选择New打开右
边的对话框。
? 打开“Demo Sequences.”文
件夹。
? 双击打开TETHIS21(见下)。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 46 -
过泸器类型
过泸器(filter)是你定义的可以使用的酶切位点的集合。在你自定义过泸器之前,所有酶切位点都会用于序列分析。你可以用和/或来组合过泸器。
MapDraw内臵的过泸器如下:
? Overhang过泸器是根据一套你定义的Overhang准则归类的酶切位
点。这些准则包括3’和5’端突出,与别的酶切位点互补以及兼并的末端突出。克隆试验中,可以使用这个过滤器寻找互补末端。 ? 频率(Frequency)过泸器是指根据出现于指定的范围序列上的频率
归类的酶切位点。我们将在本节的下一部分中使用这个过泸器型。 ? 种类和复杂性过泸器(Class & Complexity)是根据酶切位点种类
归类的酶切位点。这些种类包括:I型(随机)把II型(明确),或者I型+II型。这过泸器也可以根据位点复杂性、价钱和来源进行归类。
? 手动选择过泸器(Manual Pick)允许你按需要选定酶切位点。在随
后的一部分中,我们学习使用手动选择过泸器的方法。
? Must Cut Here/Don’t Cut Here调色板工具也是一种过滤器,随后
进行阐述。
频率过泸器应用
首先让我们用频率过泸器来删除任何可以两次切割我们序列的酶。 ? 从ENZYME MENU,选New Filter,然后Frequency打开参数对话框。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 47 -
? 在Min和Max对应的框中输入数字1和2,其他的参数不变。这个设定
将我们序列中切割多于两次的位点自动删除。 ? 在过泸器名字框中,输入“Two-cuts-max.”。
? 单击Apply将过泸器用于序列分析——然后OK退出参数对话框。你将
注意到在图上酶切位点的数目现在大大地减少了。
应用手动过泸器
虽然减少了大约3分之2的位点,但是还有100以上的酶存在。我们还可以设定一些更严紧的命令进行限制。看一看我们的酶是否能整齐地用来切割TETHIS21序列的编码区。
? 从MAP MENU选Linear Minimapp。打开的窗口显示每个限制酶切割位
点的位臵。
? 滚动窗口,直到你看到大的向右的箭头,上写“histone”。“Histone”
是在最初的Genbank入口被注释的序列特点。当我们打开它的时候,这个特点和序列一起输入。 ? 单击选定它。 ? 在屏幕的左
上单击种类调色板工具(Sort),接着选择Sort by Cuts Close to Selection。酶切位点即刻分类,这样,距特点最近而且超出选定范围的酶切位点将会排在最上面。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 48 -
? 滚动到窗口的最顶端。你将注意到,在histone基因的左和右有2酶
切位点:Acs I和Apo I。两个酶切位点对我们来说都是理想的。 现在我们将制作仅仅包括Apo I酶切位点的Manual Pick filter。 ? 从ENZYME MENU,选New Filter——然后Manual Pick。打开酶切位
点过泸器编辑器。
? 把Apo I从右边的窗口拖进左边的窗口。给过泸器取名。在这我们把
过泸器叫做“Apo I.”。
? 点击Apply——然后OK,就保存并应用
“Apo I.”过泸器了。
? 注意到现在线性的minimap仅仅由Apo I
酶切位点和histone特点构成。
使用过泸器一览表
现在我们已经应用了2个过泸器:一个叫做“Two-cuts-max”的频率过泸器和叫做“Apo I.”的手动过滤器,MapDraw会自动把两个过泸器的结果用“AND,”联合起来应用,这样,展示的结果需要满足两个标准:切割一或两次,用Apo I切割。我们手动过滤器包括频率过泸器的单一切点的内容,所以他自动的覆盖了频率过泸器的结果。下述过泸器一览表允许我们随意编辑、组合各个过泸器。
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 49 -
? 从Map Document,单击
过泸器调色板工具(在窗左上的漏斗图标)打开过泸器一览表(如
下)。当前应用的所有过泸器都出现于窗口的左边。
? 为了除掉Apo I过滤器,点击选中它,从左窗口拖到右边的窗口,单
击应用即可。现在由于只有Two-cuts-max过泸器被应用,所以序列上的酶切位点数目立即增加了。
? 把Apo I过滤器拖回,放在And旁,单击Apply再次应用Apo I过滤器,
序列上的酶切位点数目又立即减少了。(如果把Apo I过滤器拖回,放在Or旁,单击Apply再次应用Apo I过滤器,序列上的酶切位点数目不会改变,因为Apo I过滤器是Two-cuts-max过泸器的一部分)。 ? 按上面的方法把两个过滤器都去除。
使用Must Cut Here / Don’t Cut Here调色板工具
Must Cut Here / Don’t Cut Here工具是另一种酶切位点过滤限制方法。我们将用这个方法再次重复上面的操作。 ? 从MAP MENU,选Site & Sequence。
? 向下滚动,直到你看在大的向右指的箭头,上写“histone”。 单击选中。点击Don’t Cut Here调色板工具(红色园圈起的剪刀样图标),去除所有切割选定区的酶切位点。(点击Must Cut Here工具——剪刀样图标——序列上将展示所有切割选定区的酶切位点。)
L A S E R G E N E f o r W i n d o w s & M a c i n t o s h
- 50 -