[12]发明专利申请公开说明书
[21]申请号98804784.5
[51]Int.CI7
C12N 15/56C12N 15/82C12Q 1/68
[43]公开日2000年6月21日[22]申请日98.5.4
[21]申请号98804784.5
[11]公开号CN 12574A
[74]专利代理机构中国专利代理()有限公司
代理人卢新华 温宏艳
[30]优先权
[32]1997.05.06 [33]US [31]60/045,723[86]国际申请PCT/US98/09102 1998.05.04[87]国际公布WO98/50562 EN 1998.11.12[85]进入国家阶段日期
1999.11.03
[71]申请人纳幕尔杜邦公司
地址美国特拉华州威尔明顿[72]发明人K·E·布罗伊
权利要求书 2 页 说明书 35 页 附图 1 页
[]发明名称
玉米支链淀粉酶
[57]摘要
本发明涉及编码玉米支链淀粉酶全部或基本部分的分离的核酸片段。本发明还涉及编码全部或部分玉米支链淀粉酶的嵌合基因在有义或反义方向的构建,其中嵌合基因的表达导致玉米支链淀粉酶在转化的宿主细胞中的产生水平改变。
98804784.5
权 利 要 求 书
第1/2页
1.一种分离的核酸片段,它包括选自如下的成员:(a)一种分离的核酸片段,它编码选自SEQ ID NOS 2,4和8中氨基酸序列的全部或基本部分;
(b)一种分离的核酸片段,它与编码选自SEQ ID NOS 2,4和8中氨基酸序列全部或基本部分的分离核酸片段基本相似; (c)一种分离的核酸片段,它与(a)或(b)互补。 2.权利要求1的分离核酸片段,其中片段的核苷酸序列选自SEQID NOs 1,3和7。
3.一种嵌合基因,它包括可操作地连接到适宜调节序列的权利要求1的核酸片段。
4.一种转化的宿主细胞,它包括权利要求3的嵌合基因。 5.一种改变在宿主细胞中玉米支链淀粉酶表达水平的方法,它包括:
(a)用权利要求3的嵌合基因转化宿主细胞;和(b)在适于嵌合基因表达的条件下培养(a)中制备的转化宿主细胞;
其中嵌合基因的表达会导致玉米支链淀粉酶在转化的宿主细胞中产生水平改变。
6.一种获得编码全部或基本全部编码植物支链淀粉酶的氨基酸序列的核酸片段的方法,它包括:
(a)用权利要求1的核酸片段探测cDNA或基因组文库; (b)鉴定与权利要求1的核酸片段进行杂交的DNA克隆;和 (c)测定包括在(b)中鉴定出的克隆的cDNA或基因组片段的序列 其中测序的核苷酸片段编码全部或基本全部编码植物支链淀粉酶的氨基酸序列。
7.一种获得编码部分编码植物支链淀粉酶的氨基到序列的核酸片段的方法,它包括:
(a)合成与选自SEQ ID NOs 1,3和7的部分序列相应的寡核苷酸引物;和
(b)用(a)中的寡核苷酸引物和代表克隆载体序列的引物扩增存在于克隆载体的cDNA插入子;
2
98804784.5权 利 要 求 书 第2/2页
其中所扩增的核酸片段编码部分编码植物支链淀粉酶的氨基酸序列。
8.权利要求6中方法的产物。 9.权利要求7中方法的产物。
3
98804784.5
说 明 书
玉米支链淀粉酶
第1/35页
发明领域
本发明属于植物分子生物学范畴。更具体而言,本发明涉及编码参与淀粉在玉米植物和种子中淀粉生物合成的酶的核酸片段。
发明背景
玉米淀粉是食物、饲料和工业产品的一重要组分。广义地讲,它由2种类型的葡聚糖聚合物组成:有几个稍许的有相对长链的聚合物-直链淀粉,和链较短但高度分支的分子,叫做支链淀粉。它们的合成依赖于多个酶间复杂的相互作用(Smith,A.等,(1995)植物生理学,107:673-677;Preiss,J.(1988)植物生化14:181-253)。它们中重要的是ADP-葡萄糖焦磷酸化酶,它催化ADP-葡萄糖的生成;以ADP-葡萄糖作底物,应用α-1,4连接形成聚合物的一系列淀粉合成酶;和几种淀粉分支酶,它们通过α,1-6连接将聚合物的一部分转移到它的另一部分来修饰聚合物。但是根据来自其它淀粉形成植物,如土豆和玉米突变物的数据,已逐步明了其它酶在确定淀粉的最终结构上也起到一定作用。尤其是,脱支酶,如异淀粉酶和支链淀粉酶,和非对称酶不仅参与淀粉的降解,而且在淀粉合成的过程中修饰其结构。已设计了不同的作用模式,但是全有这些均共享同一观点,即它们的活性,或其缺失改变了所产生淀粉的结构。
这有应用的意义,因为淀粉结构的改变,例如直链淀粉和支链淀粉的相对含量或者支链淀粉分支长度和程度的改变可在烹饪和工业过程中改变其功能。例如,来自自然发生突变的不同谷物的淀粉可一方面区别其结构上的不同,同时区别其功能上的差异,如Rapid Visco分析,当淀粉被加垫然后冷却后可测定其粘度的改变(Walker,C.E.,(1988)谷类食物世界33:491-494)。不同酶间的相互作用产生不同的结构,随之不同的结构如何与不同的功能相关,尚未完全阐明。但是,变化的淀粉结构会导致淀粉功能的改变,而淀粉功能的改变会导致新的应用或降低加工处理过程的消费(目前某些淀粉功能只能通过对淀粉进行昂贵的化学修饰而获得)是已知的。
4
98804784.5说 明 书 第2/35页
脱支酶在淀粉合成中的作用,尤其是影响分支程度的作用谷物中这些基因的过度表达或表达降低可用于玉米淀粉支链的分布。尽管已对其它植物的支链淀粉酶基因有所描述(美国专利号5514576;NakamuraY.等(1996)植物(2):209-218;Renz.A.等,(1995)EMBL登记号1076269),但对玉米的支链淀粉酶基因尚未有所记载。
发明简述
本发明涉及编码玉米支链淀粉酶的单一核酸片段。此外,本发明涉及与编码玉米支链淀粉酶的核酸片段互补的核酸片段。
此外本发明涉及编码玉米支链淀粉酶的嵌合基因或者与编码玉米支链淀粉酶的核酸片段互补的核酸片段,它们可操作地连接到了适宜的调节序列上。其中嵌合基因的表达可引起玉米支链淀粉酶在转染的宿主细胞中的产生水平改变。
在另一实施方案中,本发明涉及转化的宿主细胞,它可操作地连接到了适宜的调节序列上,其基因组中包含了编码玉米支链淀粉酶的嵌合基因,其中嵌合基因的表达能引起玉米支链淀粉酶在转化的宿主细胞中产生水平的改变。转化的宿主细胞可来源于真核生物或原核生物,包括来源于高等植物和微生物的细胞。本发明还包括由转化的高等植物宿主细胞产生的转化植物和由该转化植物而来的种子。
此外,本发明的另一实施方案涉及一种改变玉米支链淀粉酶在转化的宿主细胞中表达水平的方法,它包括a)用编码玉米支链淀粉酶,可操作地连接了适宜调节序列的嵌合基因转化宿主细胞;b)在适于嵌合基因表达的条件下培养转化的宿主细胞,其中嵌合基因的表达能改变玉米支链淀粉酶在转化的宿主细胞中的产生水平。
本发明的另一实施方案还涉及一种获得核酸片段的方法,该核酸片段编码全部或基本上所有编码植物支链淀粉酶的氨基酸序列。 附图简述及序列描述
由以下详细的描述和对应的图例以及对序列的描述将对本发明有更为全面的理解,这些描述是本申请的一部分。
图1是SEQ ID NO:8(Sbjct)中玉米支链淀粉酶和GenBank登记号D50602(Query)中稻(Oryza sativa)支链淀粉酶的氨基酸序列的对比。
5
98804784.5说 明 书 第3/35页
SEQ ID NO:1是编码部分玉米支链淀粉酶的cDNA克隆cen3n.pk0028.d2的核苷酸序列。
SEQ ID NO:2是由cDNA克隆cen3n.pk0028.d2的核苷酸序列翻译而推断出的氨基酸序列。
SEQ ID NO:3是编码玉米支链淀粉酶一部分的cDNA克隆cen3n.pk0031.h9的核苷酸序列。
SEQ ID NO:4是由cDNA克隆cen3n.pk0031.h9的核苷酸序列进行翻译而推断出的氨基酸序列。
SEQ ID NO:5是编码DDBJ登记号D.50602号稻支链淀粉酶的氨基酸序列。
SEQ ID NO:6是编码具有GenBank登记号X83969的菠菜(Spinacia oleracea)支链淀粉酶的氨基酸序列。
SEQ ID NO:7是编码部分玉米支链淀粉酶的cDNA克隆的核苷酸序列。
SEQ ID NO:8是由SEQ ID NO:7所编码的cDNA克隆的核苷酸序列进行翻译而推断出的氨基酸序列。
这里参照核酸研究13:3021-3030(1985)和生化杂志219(21:345-373(1984)所描述的,在序列描述中与IUPAC-IYUB标准一致,核苷酸序列为单字符,氨基酸为三字符)。
发明详述
本公开中将用到一些术语。此如这里所讲的“分离的核酸片段”是单链或双链的RNA或DNA聚合物,可选择性地含有合成的、非天然的或加工了的核苷酸碱基。DNA聚合物形成的的核酸片段可包括一个或多个cDNA片段,基因组DNA或合成的DNA。
这里所讲的“基本上相似”是指一个或多个核苷酸碱基发生改变的核酸片段会引起一个或多个氨基酸的置换,但是并不影响由该DNA所编码的蛋白质的功能特性。“基本上相似”也指一个或多个核苷酸碱基发生了改变的核酸片段不影响核酸片段通过反义或共抑制技术介导基因表达改变的能力。“基本上相似”还指本发明核酸片段的修饰,如一个或多个碱基的缺失或插入基本上不影响所得转录本的功能特征,即利用反义或共抑制技术介导基本表达改变的能力或所得蛋白分子功能特性的改变由此可以理解本发明不只包括特异的典型序列。
6
98804784.5说 明 书 第4/35页
例如,众所周知基因表达的反义抑制和共抑制可应用小于基因整个编码区域的核酸片段以及与所抑基因没有达到100%一致的核酸片段来完成。而且基因的改变可在所指位点得到化学上等价的氨基酸,但不影响所编码蛋白质的功能特性,在本领域内也是众所周知的。因此,编码疏水性氨基酸丙氨酸的密码子可被编码另外疏水性较弱的残基,如甘氨酸所替代,或被更疏水性的残基,如缬氨酸、亮氨酸或异亮氨酸所取代。同样,一个负电荷残基由另一个所取代的改变,如天冬氨酸取代谷氨酸,或者一个正电荷残基由另外一个所取代的改变,如赖氨酸取代精氨酸,也预期能生产出功能上等价的产物。也不期望能引起蛋白分子N-末端和C-末端部分改变的核苷酸变化能引起蛋白活性的变化。所设计的每种修饰均属于本领域的常规技术,就象保留编码的产物的生物活性的检测。而且技术人员认识到本发明包括的基本相似的序列也可通过在严格条件下(0.1×SSC,0.1%SDS,65℃)与运里的典型序列进行杂交的能力进行确定。本发明优选的基本相似的核苷酸片段是其DNA序列与这里报道的核苷酸片段的DNA序列80%一致的核酸片段。更优选的是与这里报道的核酸片段的DNA序列90%一级的核酸片段。最优选的核酸片段是其DNA序列与这里报道的核酸片段的DNA序列95%一致。
氨基酸或核酸序列的“基本部分”包括足够的一种多肽的氨基酸序列或一个基因的核苷酸序列,以能够对该多肽或基因进行推定,不管是由本领域的技术人员手工测序还是应用推算法,如BLAST(Basic
Local Alignment Search Tool;Altschul,S.F.,等(1993)分子生物学杂志,215:403-410;或参见www.ncbi.nlm.nih.gov/BLAST/)
通过计算机自动比较和鉴定序列。总起来讲,为了能推断一种多肽或核苷酸序列与已知蛋白或基因的同源性,10个或多个连续氨基酸序列或者30或多个核苷酸是必需的。而且,就核酸序列而言,包括20-30个连续核苷酸的基因特异的寡核苷酸探针可用于基因鉴定(如Southern杂交)和分离(如细菌克隆或噬菌斑的原位杂交)等序列依赖性方法。另外,12-15个碱基的短寡核苷酸可用作PCR中的扩增片段,以获得包括该引物的特殊核酸片段。因此,核苷酸序列的“基本部分”包括足够的能对包括该序列的核酸片段进行特异鉴定和/或分离的序列。本说明书阐述了部分或全部编码一个或多个特殊植物蛋白的氨基酸和核
7
98804784.5说 明 书 第5/35页
苷酸序列。得利于这里所报告的序列,技术人员现在可以应用公开的全部序列或其基本部分以达到本领域的技术人员所知的目的。因此,本发明包括在相应的序列表中报告的全部序列,以及上面所规定的那些序列的基本部分。
“密码子简并性”指基因密码子允许核苷酸序列的多样化而不影响所编码多肽的氨基酸序列。因此本发明涉及任何一种核酸片段,它编码SEQ ID NOS:2,4和8中所示玉米支链淀粉酶蛋白的氨基酸序列的全部或基本部分。技术人员熟悉一种特异的宿主细胞在应用核苷酸密码子指定一种给出的氨基时存在“密码子偏倚性”。因此,当合成一基因以提高在宿主细胞中的表达时,希望这样设计该基因,密码子使用的机率接近宿主细胞中优选的密码子使用的机率。
“合成的基因”可从应用本领域的技术人员熟知的工序化学合成的寡核苷酸建筑模块进行装配。连接这些建筑模块,退火,形成基因片段,然后用酶进行装配以构建整个基因。“化学合成”,涉及DNA的序列,它是指合成的核苷酸在体外进行装配。DNA的人工化学合成可应用已建立良好的程序进行,或者自动化学合成可应用许多市售机器中的一种来进行。因此,在能够反映宿主细胞密码子偏倚性的最适核苷酸序列的基础上,基因可被加尾修饰,以适于基因表达。如果密码子使用倾向于宿主所喜爱的那些密码子,技术人员赞同基因成功表达的可能性。在调查来源于序列信息可知的宿主细胞的基因的基础上,可确定优选密码子。
“基因”指表达特定蛋白质的核酸片段,它包括编码序列前(5′-非编码序列)和后(3′非-编码序列)的调节序列。“天然基因”指具有其自己调节序列在自然界中发现的基因。“嵌合基因”指任何一种非天然基因,包括在自然界中不能同时发现其调节和编码序列。由此,一个嵌合基因可包括来自不同来源的调节序列和编码序列,或者调节序列和编码序列来源一致,但其排列方式不同于自然界中发现的。“内源性基因”指在有机物的基因组中以其自然位置存在的天然基因。“外源”基因指通常在宿主有机体中不能找到的基因,但它是通过基因转移导入宿主有机体的。外源基因可包括插入到非天然有机体的天然基因或嵌合基因。“转基因”指通过转化将基因转入基因组。
8
98804784.5说 明 书 第6/35页
“编码序列”指编码特殊氨基到序列的DNA序列。“调节序列”指位于编码序列上游(5′非编码序列),之中,或下游(3′非编码序列)的核苷酸序列,并且它能影响相关编码序列的转录,RNA加工或稳定,或翻译。调节序列可包括启动子,翻译引导序列,内含子和poly A识别序列。
“启动子”指能够控制编码序列表达的DNA序列或功能性RNA。通常,启动子序列位于编码序列的3′。启动子序列由邻近和较远的上游元件组成,后面的元件通常指增强子。因此,“增强子”是这样一种DNA序列,它能刺激启动子活性且有可能是启动子原有的元件,或者是为了增强启动子的水平或组织特异性而插入的异源成分。启动子可以它们整体的形式来自天然基因,或由来自自然界中不同启动子的不同分子组成,或者甚至包括合成的DNA片段。本领域的技术人员知道不同的启动子可指导基因在不同组织或细胞类型中的表达,或者在发育的不同阶段,或对不同的环境条件应后的过程中表达。那些能引起基因在大多数细胞类型于大部分时间表达的启动子通常指“组成型启动子”。人们不断地发现植物细胞中应用的各种类型的新启动子;可在Okamuro和Goldberg,(19)植物生化15:1-82的汇编中发现大量的实例。人们还认识到因为大多数情况下调节序列的确切边界尚未完全确定,所以不同长度的DNA片段也许有同一启动子活性。
“翻译引导序列”指位于基因的启动子序列和编码序列之间的DNA序列。翻译引导序列存在于全部加工的mRNA翻译起始序列的上游。翻译引导序列可影响初级转录本向mRNA的加工,mRNA稳定性或翻
译效率。翻译引导序列的例子已有论述(Turner,R.和Foster,G.D.(1995)分子生物技术3:225)。
“3′非编码序列”指位于编码序列下游的DNA序列,且包括polyA识别序列和其它一些编码能影响mRNA加工或基因表达的调节信号的序列。poly A信号的特征通常在于影响聚腺苷酸序列段添加至mRNA前体的3′末端。Ingelbreche等(19)植物细胞1:671-680对不同的3′-非编码序列进行了举例说明。
“RNA转录本”指由RNA聚合酶催化的DNA序列转录的产物。当RNA转录本是DNA序列完全互补的拷贝时,称之为初级转录本或者是初级转录本经转录后加工而得的RNA序列,称之为成熟RNA。“信
9
98804784.5说 明 书 第7/35页
使RNA(mRNA)是指没有内含子且能被细胞翻译成蛋白质的RNA。“cDNA”指双链DNA,来自mRNA并与之互补,“有义”RNA指
RNA转录本,它包括mRNA,于是可被细胞翻译成蛋白质。“反义RNA”是指这样的RNA转录本,它完全或部分与目的初级转录本或mRNA互补并阻滞了目的基因的表达(美国专利号5,107,065)。反义RNA的互补性可与特异基因转录本的任何一部分进行,即在5′非编码序列,3′非编码序列,内含子或编码序列。“功能RNA”指反义RNA,核糖酶RNA,或其它没得到翻译但对细胞的加工过程还有影响的RNA。
术语“可操作性连接”指在单个核酸片段上的核酸序列间的联系,以使一个的功能受到另一个的影响。例如,当启动子能影响编码序列的表达(即,编码序列在启动子的转录控制之下)时,它可连接该编码序列。编码序列可在有义或反义向连接调节序列。
这里的“表达”一词是指来自本发明的核酸片段的有义(mRNA)或反义RNA的转录或稳定积累。表达也指mRNA翻译成多肽。“反义抑制”指能抑制目的蛋白质表达的反义RNA转录的产物。“过度表达”指在转基因有机体中基因产物的产生超过在正常或非转化有机体中的产生水平。“共抑制”指能抑制同一或基本上同一外源或内源基因表达的有义RNA转录本的产生(美国专利号5,231,020)。
“水平变化”是指在转基因有机体中基因产物的产生在数量或比例上不同于正常或非转化的有机体。
“成熟”蛋白质指翻译后加工了的多肽,即由此存在于初级翻译产物的前或原肽被清除。“前体”蛋白质指mRNA翻译的初级产物,即前和原肽仍然存在。前肽和原肽是但并不仅限于是细胞内定位的信号。 “叶绿体转运肽”是一氨基酸序列,它连同一蛋白质一起进行被翻译,驱使蛋白质到叶绿体或到产生蛋白质的细胞中存在的其它质体中。“叶绿体转运序列”指编码叶绿体转运肽的核苷酸序列。“信号肽”是一氨基酸序列,它连同一蛋白质一起被翻译,并且使蛋白质到达分泌系统(Chrispeels.J.J.,(1991)Ann,Rev.Plant Phys.Plant Mol.Biol.42:21-53)。如果蛋白质被引到空泡,还可添加空泡定向信号(上文),或者,若被引到内质网,还可添加内质网滞留信号(上文)。如果蛋白质到达细胞核,存在的任何信号肽将被移去,而包括了核定位信号(Raikhel(1992)植物生理,100:1627-1632)。
10
98804784.5说 明 书 第8/35页
“转化”是指将核酸片段转入宿主有机体的基因组,而造成遗传学上的稳定遗传。包含转化的核酸片段的宿主有机体称作“转基因”的有机体。植物转化方法的例子包括土壤杆菌介导的转化(De Blaere等,(1987)酶学方法,143:277)和粒子加速或“基因”转化技术(Klein等,(1987)自然(London)327:70-73;美国专利号4945050)。 这里所应用的标准的重组DNA和分子克隆技术是本领域的人熟知的,在Sambrook,J.Fritsch,E.F.和Maniatis T.的分子克隆:实验手册;冷泉港实验室出版,冷泉港,19(此后“Maniatis”一书中有更全面的描述)。
通过应用本领域的技术人员所熟知的BLAST计算法,将随机植物的cDNA序列与GenBank数据库进行比较已分离和鉴定出编码玉米支链淀粉酶基因的cDNA克隆。这些玉米支链淀粉酶cDNA的核苷酸序列列于SEQ ID NOS 1和3,推断出的氨基酸列于SEQ ID NOS 2
和4。通过将其它植物的随机cDNA序列与这里提供的玉米支链淀粉酶的序列进行比较可鉴定出其它植物的支链淀粉酶基因。
本发明的核酸片段可用于从同一或其它植物种类中分离编码同源支链淀粉酶的cDNA和基因。应用序列依赖性方法来分离同源基因的方法在本领域是众所周知的。序列依赖性方案的例子包括核酸杂交的方法,和通过核酸扩增技术的各种应用所说明的DNA和RNA扩增的方法(如,聚合酶链式反应,连接酶链式反应),但并不限于这些方法。如这里所描述的,可应用插入的部分从cDNA克隆分离出编码全部或几乎所有玉米支链淀粉酶(SEQ ID NO:7)的核酸片段,而cDNA克隆是通过将随机植物的cDNA序列与GenBank数据库(cen3n.pk0028.d2见实施例2)进行对比而鉴定出的。
例如,其它支链淀粉酶基因,cDNA或基因组DNA可这样直接分离:应用本发明的玉米支链淀粉酶基因的全部或部分作为DNA杂交探针,应用本领域的技术人员熟知的酶学方法从所期望的植物中筛选文库。可用本领域中已知的方法(Maniatis)来设计和合成以本支链淀粉酶序列为基础的特异寡核苷酸探针。而且,可应用技术人员已知的方法,如随机引物DNA标记,缺口翻译,或末端标记技术,或在体外翻译系统中应用的RNA探针等,直接应用全长序列合成DNA探针。此外可设计特殊的引物用于本序列全长或部分扩增。可在扩增反应的过程中
11
98804784.5说 明 书 第9/35页
直接标记所得的扩增产物或者在扩增反应之后进行标记,用该产物作探针可在适当严格条件下分离全长cDNA或基因组片段。
此外,本核苷酸片段的两个短部分可在聚合酶链式反应中应用,以从DNA或RNA扩增更长的编码同源支链淀粉酶的核酸片段。聚合酶链式反应也可在核酸片段的文库上进行,其中一个引物的序列来自本核酸片段,另一个引物的序列利用了编码植物支链淀粉酶的mRNA前体的3′末端存在的聚腺苷酸序列段。替代地,第二个引物的序列可以来自克隆载体的为基础。例如,技术人员可通过应用PCR来扩增位于转录本单个点和3′和5′末端间的区域,按照RACE方案(Frohman等,(1988)PNAS USA 85:98)产生cDNA可从本序列设计定位于3′和5′方向的引物。应用市售的3′RACE或5′RACE系统(BRL)可分离特异的3′或5′片段(Ohara等,(19)PNAS USA 86:5673;Loh等,(19)科学243:217)。可合并由3′和5′RACE程序所产生的产物以产生全长cDNA(Frohman,M.A.和Martin,G.R.(19)技术1:165)。
最后,本核苷酸和所推测氨基酸的可用性有利于cDNA表达文库的免疫筛选。代表本核苷酸序列的部分的合成肽可被合成。可用这些肽免疫动物以制备对包括本氨基酸序列的肽或蛋白质特异的多克隆或单克隆抗体。然后这些抗体可用于筛选cDNA表达文库以分离目的cDNA克隆的全长(Lerner,R.A.(1984)免疫学进展,36:1;Maniatis)。 本发明的核苷酸片段可用于制备转基因植物,其中玉米支链淀粉酶以较正常高或低的水平存在,或用于细胞类型或发育阶段,其中它不常被发现。这在那些细胞中具有改变淀粉结构的功效。
玉米支链淀粉酶的过度表达可这样完成:首先构建一嵌合基因,其中玉米支链淀粉酶的编码区连接到一启动子,该启动子能在所期望的发育阶段在期望的组织中引导基因的表达。为了便利,嵌合基因可包括来源于同一基因的启动子序列的翻译引导序列。必需提供编码转录终止信号的3′非编码序列。为了利于基因表达,该嵌合基因也可包含一个或多个内含子。
于是包含该嵌合基因的质粒载体就可构建。质粒载体的选择依赖于将用于转化宿主植物的方法。技术人员熟知为了成功的转化、选择和繁殖含有嵌合基因的宿主细胞,在质粒载体上必须存在的遗传因子。技术
12
98804784.5说 明 书 第10/35页
人员还认识到不同的的转化作用将导致表达水平和方式的不同(Jones等,(1985))EMBO J,4:2411-2418;De Almeida等,(19)Mol.Gen.Genetics 218:78-86),因此为了得到显示所期望表达水平和方式的系列,必需对大量的转化体进行筛选。可通过DNA的Southern分析,mRNA表达的Northern分析,蛋白质表达的Western分析或表型分析来进行筛选。
也许对一些应用来说,引导支链淀粉酶到不同的细胞腔隙,或使它从细胞中方便的分泌是有用的出来。于是可以设想上述的嵌合基因可被进一步补充,通过改变编码序列从事之编码添加了具有适当的细胞内靶向序列的支链淀粉酶蛋白质,如转运序列(keegstra,k.(19)细胞,56:247-253),信号序列或编码内质网定位的序列(Chrispeels,J.J.,(1991)Ann.Rev.Plant Phys.Plant Mol.Biol.42:21-53)或核定位信号(Raikhel,N.(1992)植物生理100:1627-1632),和/或目的序列已移清除了的支链淀粉酶蛋白。尽管引用的参考文献给出了每一种的例子,但清单并未到尽头,将来会发现更多应用的靶向信号。在一些应用中还描述了减少或消除支链淀粉酶基因在植物中的表达。为了达到此目的,可通过将支链淀粉酶基因或基因片段连接到植物的启动子序列而构建为支链淀粉酶共抑制而设计的嵌合基因。可替代地,可通过将支链淀粉酶基因或基因片段的相反方向连接到的启动子序列而构建为表达支链淀粉酶基因全部或部分的反义RNA而设计的嵌合基因。不管是共抑制还是反义嵌合基因,均能通过转化导入到植物,其中内源性支链淀粉酶基因的表达减弱或消除。
在异源的宿主细胞中,特别是在微生物宿主的细胞中产生的玉米支链淀粉酶蛋白,通过应用本领域中熟知的方法,可用于制备针对蛋白的抗体。抗体有利于在细胞中原位检测玉米支链淀粉酶蛋白或在细胞提取物中体外检测。优选的生产玉米支链淀粉酶蛋白的异源宿主细胞为微生物。本领域的技术人员熟知的微生物的表达系统和包含调节序列的表达载体引导外源蛋白质的高表达。它们的任一种可用于构建生产玉米支链淀粉酶的嵌合基因。然后这些嵌合基因通过转化作用导入适当的微生物中以提供玉米支链淀粉酶的高表达。提供了在细菌中高表达玉米支链淀粉酶的载体的例子(实施例4)。
13
98804784.5说 明 书 第11/35页
本发明的全部或部分核酸片段还可用作探针以对它们为其中一部分的基因进行遗传和生理上的定位,也可在与玉米支链淀粉酶表达相关的试验中用作标记物。这些信息也许多在谷物的培育上有益,以发展具有期望的淀粉表型的品系。
例如,本核苷酸片段可用作性片段长度多态性(RFLP)的标记物。性消化的植物基组DNA的Southern印迹(Maniatis)中可用本发明的核苷酸片段作探针。然后用计算机程序如MapMaker(Lander等,(1987)基因组1:174-181)对所得的结合方式进行基因分析以构建基因图谱。此外本发明的核苷酸片段可在包含代表父母和后代有规定的基因交差的一对个体的性内切酶处理的基因组DNA的Southern印迹中用作探针。人DNA多形态的分离是显著的,用它在预先用这些群体获得的基因图谱中计算该核苷酸序列的位置(BotsteinD.等(1980)美国人类遗传学杂志,30:314-331)。
植物基因产生的探针用于基因图谱的应用和产生记载于
R.Bernatzky,R和Tanksley,S.D.(1986)植物分子生物报道4(1):37-41。许多出版物记载了用上面描述的方法学或其变异方式来制备特殊cDNA克隆的基因图谱。例如,F2代互交群体,回交群体,随机交配的群体,接近同基因的品系,和其它的一些个体可用于定位。这些方法学是本领域的技术人员所熟知的。
来自本核苷酸序列的核酸探针也可用于生理定位(即序列在生理图谱的安排;参见Hoheisel,J.D.等非哺乳类动物基因组分类:应用指南,学术出版社1996,pp.319-346,在此引用)。
在其它实施方案中,来自本核酸序列的核酸探针可用于直接荧光原位杂交(FISH)定位。尽管目前FISH定位的方法喜欢应用大克隆(几个到几百个KB),但为了提高其敏感度可应用较短的探针进行FISH定位。
大量基于核苷酸扩增的遗传和生理定位的方法可应用本核酸序列进行。实施例包括等位基因特异的扩增,多形态PCR扩增的片段(CAPS),等位基因特异的连接,核苷酸延伸反应,放射性杂交图谱和Happy图谱。在这些方法中,核苷酸片段的序列是用于设计和制备在扩增反应或引物延伸反应中应用的引物对引物的设计是本领域的技术人员所熟知的。在应用以PCR为基础的遗传作图方法中有必要鉴定在
14
98804784.5说 明 书 第12/35页
相对于本核苷酸序列的区域图谱交叉的双亲DNA序列的差异。但是这对于作图方法是非必要的。这些信息有利于玉米培育,以培养出有所期望表型的品种。
实施例
在下面的实施例中对本发明作进一步解释,如没其它说明,其中所有部分和百分率为重量化,温度为摄氏度。应该明白虽然这些例子表明了本发明的优选方案,但仅是一说明。通过上面的讨论和这些实例,本领域的技术人员会确定本发明的基本特征,在不偏离其宗旨和范围的情况下,可对本发明进行不同的改变和调整以适于不同的应用和条件。 实施例1
玉米cDNA文库的构成,cDNA克隆的分离和测序
在授粉20天后从玉米(Zea mays)LE392的内胚乳中制备代表mRNA的cDNA文库,遵照产品说明(Stratagene Cloning SystemLa jolla,CA)在Uni-ZAPXR载体中制备cDNA文库。按照由Stratagene提供的方案把Uni-ZAPXR文库转变为质粒文库。在转变中,cDNA插入物在质粒载体pBluescript中获得。基本上按照美国专利5,482,845中公开的方案cDNA文库标准化。从包含重组pBluescript质粒的细菌克隆随机挑选出的cDNA插入通过聚合酶链式反应进行扩增,所用的引物是对位于插入的玉米cDNA序列两侧的载体序列特异的引物。按照由Perkin-Elmer提供的方案在染料-引物测序反应中测定扩增的插入DNA的序列,所得产物用Perkin-Elmer ABI PRISM 377DNA测序仪进行分析。
实施例2
cDNA克隆的鉴定和特征描述
通过运行BLAST(Basic Local Aligment Search Tool;Altschul;S.F.等(1990)分子生物学杂志,215:403-410;亦可查www.ncbi.nlm.nih.gov/BLAST/)寻找与GenBank数据库获得的序列的相类似,来鉴定编码玉米支链淀粉酶的cDNA。应用由国家生物技术信息中心(NCBI)提供的BLASTN规则系统来分析例中获得的cDNA
15
TM
TM
TM
98804784.5说 明 书 第13/35页
序列与含有在GenBank数据库中得到的公开DNA序列的相类似。在所有的阅读框中DNA序列都被翻译,应用NCBI提供的BLASTX法则(Gish.W和States.D.J.(1993)天然遗传学,3:266-272)比较与在GenBank数据库中得到的所有公开蛋白质序列的相类似。
应用克隆cen3n.pk0028.d2进行的BLASTN检索表明本核苷酸序列与美国专利NO.5,514,576(GenBank登记号,120414;logP=1.96)报告的编码稻子(Oryza sativa)支链淀粉酶的核苷酸序列相类似。
用克隆cen3n.pk0028.d2进行的BLASTX检索表明由该cDNA编码的蛋白质与稻子(DDJB登记号D50602;log P=112.55)和菠菜(Spinacia oleracea)(GenBank登记号X 83969;log P=81.36)支链淀粉酶相类似。SEQ ID NO:1中给出了支链淀粉酶cDNA的核苷酸序列,相应的氨基酸序列在SEQ ID NO:2中显示。该玉米支链淀粉酶的氨基酸序列与稻子和波菜支链淀粉酶的序列的一致性分别为83%和63%。
应用上述方法对编码该玉米支链淀粉酶不同部分的其它cDNA克隆进行了鉴定。应用克隆cen3n.pk0031.h9进行的BLASTX检索也表明由该cDNA编码的蛋白质与稻子(DDJB登记号D50602;log P=60.74)和菠菜(GenBank登记号X 83969,log P=35.7支链淀粉酶相类。SEQ ID NO:3中为该支链淀粉酶cDNA的核苷酸序列,相应的氨基酸序列位于SEQ ID NO:4中。该玉米支链淀粉酶的氨基酸序列与稻子和菠菜支链淀粉酶序列的一致性分别为77%和55%。 用cDNA克隆cen3n.pk0028.d2中插入物的一1291bp的EcoRI片段作杂交探针,在玉米内胚乳cDNA文库(授粉20天后提取mRNA)中筛选玉米支链淀粉酶的全长序列。大约双份2.8×10pfu转移到纤维素膜上。固定了的DNA与放射性标记的EcoRI片段进行杂交,基本按照Maniatis描述的进行洗涤。由初次筛选鉴定出18个推定的阳性克隆。发现其中一个阳性克隆,pDBE6A包含最长的cDNA插入。纯化该克隆进一步特征化。插入到pDBE6A的cDNA的全部序列列于SEQID NO:7。2904bp的插入物包含编码878个氨基酸多肽(SEQ IDNO:8)的2638bp开放阅读框,随之为245bp的3′端非翻译的DNA和21bp的poly A。所推测的氨基酸序列的排列与稻子支链淀粉酶的
16
6
98804784.5说 明 书 第14/35页
序列在氨基酸水平上的一致性达75%(图1)。序列排列和百分率的计算应用Altschul等((1990)分子生物学杂志215:403-410)描述的计算方法进行。序列排列和BLAST分数和概率提示本核苷酸片段编码整个或几乎整个玉米支链淀粉酶。 实施例3
嵌合基因在植物细胞中的表达
可以构建一个嵌合基因,它包括一正向定位的玉米支链淀粉酶。定位于玉米支链淀粉酶片段5′端的玉米27KD的玉米醇溶蛋白启动子和定位于玉米支链淀粉酶3′端的10KD玉米醇溶蛋白的3′端。应用适当的寡核苷酸引物,通过包括该玉米支链淀粉酶的cDNA克隆的聚合酶链式反应(PCR)可产生该基因的玉米支链淀粉酶片段。当如下插入到消化的载体pML103时,克隆位点(NcoI或SmaI)可整合到寡核苷酸以提供正确的DNA片段的定位。扩增在100μl标准PCR混合物中进行,该混合物由0.4mM的各种寡核苷酸和在10mM Tris-HCl,pH8.3中配制的0.3pM的目的DNA,50mM KCl,1.5mM MgCl2 0.001%w/v明胶,200mM dGTP,200mM dATP,200mM dTTP,200mM
dCTP和0.025单位Amplitaq DNA聚合酶组成。反应在Perkin-ElmerCetus Thermocyler中进行30个循环,1个循环包括95℃ 1分钟,55℃ 2分钟和72℃ 3分钟。在最后一个循环之后72℃延伸7分钟。然后用性酶NcoI和SmaI消化扩增产物,在40mM Tris-醋酸盐,pH8.5,1mM EDTA配制的0.1%低熔点琼脂糖凝胶上分离。从胶上切下适宜的带,68℃熔解,与4.9kb的质粒pML103的NcoI-SmaI片段结合。质粒pML103根据布达佩斯条约保藏于ATCC(美国典型培养物保藏中心,12301 Parklawn Drive,Rockville,MD 20852),其登记号为ATCC 97366。由pML103而来的DNA片段包含一个玉米7KD玉米醇溶蛋白基因的1.05kb的SalI-NcoI启动子片段和一个0.96kb的SmaI-SalI片段,它来自载体pGem9Zf(+)(Promega)中玉米10KD醇溶蛋白基因的3′端。载体和插入DNA可在15℃连接,过夜,基本上按上文(Maniatis)记载的。然后连接的DNA就可用于转化E.Coli XL1-Blue(Epicurian Coli XL-1 Blue,Stratagene)。通过质粒DNA的性酶消化和应用双脱氧链终止方法(Sequenase
17
TM
TM
TM
TM
98804784.5说 明 书 第15/35页
DNA Sequening kit;U.S.Biochemical)进行的有限性核苷酸序列分析来筛选细胞的转化体。所得的质粒结构应该包括在5′和3′方向编码的嵌合基因,玉米27KD的玉米醇溶蛋白启动子,玉米支链淀粉酶化片段和10KD玉米醇溶蛋白的区域。
然后可按照下面的方法将上述的嵌合基因导入玉米细胞。可从由纯系谷物H99和LH132的交配而来的发育着的颖果分离末成熟的谷物胚胎。在授粉10~11天后当它们长到1.0-1.5mm长时分离胚胎。然后轴面朝下放置胚胎,并与琼脂糖固化了的N6培养基(Chu等,(1975)Sci.Sin.Peking,18:659-668)接触。将胚胎于27℃放置暗处。由带着在悬带结构上产生的机体原胚胎样和胚胎样物质的未分化的细胞团组成的粉状的胚胎生成的愈伤组织。从这些不成熟胚胎的盾片开始增殖。从初级外植物扩展分离出的胚胎生成的愈伤组织培养在N6培养基上,并且能每2-3周在该培养基上进行亚培养。
为了提供可选择的标志物,质粒p35S/Ac(来自Peter Ecks博士,Hoechst Ag,Frankfurt,Germany)可用于转化实验。该质粒中包含编码膦丝菌素乙酰基转移酶(PAT)的Pat基因(参见欧洲专利公开0 242236)。该酶PAT对除草剂的谷氨酰胺合成酶抑制物如膦丝菌素具有抵抗性。p35S/Ac中的pat基因在来自花椰菜花叶病毒35S启动子(Odell等(1985)自然313:810-812)和胭脂碱合成酶基因3′区域的控制下,后者来自根癌农壤杆菌的Ti质粒的T-DNA。
可用粒子轰击的方法(Klein等,(1987)自然327:70-73)将基因转移给愈伤组织的培养细胞。依照该方法,可按下面的技术用DNA包被金粒(直径,μm)将10μg的质粒DNA加入到50μl金粒的悬液中(60mg/ml)。向颗粒中加入氯化钙(50μl的2.5M溶液)和不含亚精胺的碱(1.0M的溶液20μl)。边加入这些溶液边旋转悬液,10分钟后,瞬时离心(5秒,15000rpm)弃去上清。将颗粒重悬于200μl纯乙醇中,再次离心弃上清。再次进行乙醇洗涤,最后将颗粒重悬于30μl乙醇中。DNA包被的金属颗粒的一部分(5μl)可放置于Kapton飞盘(Bio-Rad Lads)的中心,然后应用Biolistic POS-1000/He(Bio-Rad Tnstraments,Hercules,CA)将粒子加速到玉米组织,应用的氦压为1000psi,缝隙距离为0.5cm,飞行距离为1.0cm。
18
TM
TM
98804784.5说 明 书 第16/35页
轰击时,胚胎产生的组织放置于琼脂糖固化的N6培养基之上的滤纸上,象薄薄的一层菌苔那样放置组织,使之覆盖直径大约5cm的一环形区域。培养皿可放置于离终止屏大约8cm的PDS-1000/He的室中。然后室中的空气排空为28英寸Hg的真空。用氮冲击被对巨大的载体进行加速,其中应用了破裂膜以便当冲击管中的氦压力达到1000psi时它能爆发。
轰击七天以后可把组织转移到含有glyphosinate(2mg/L)缺乏酪蛋白或脯氨酸的N6培养基上,组织继续在该培养基上缓慢生长。再过2周后,可把组织转移到含有glyphosinate的新鲜N6培养基上。6周后在一些含有补充了glyphosinate的培养基的平皿中可看到直径大约1cm活跃生长的愈伤组织。当这些愈伤组织在选择性培养基上进行亚培养时仍可继续生长。
通过将组织群初次转移到补充了0.2mg/L的2,4-D的N6培养基上,植物可从转基因的愈伤组织再生。两周后可将组织转移到再生培养基(Fronm等,(1990)生物/技术学8:833-839)。
然后就能分析从转化了嵌合基因的玉米植物的单个种子提取出的淀粉。将种子浸泡在含有1.0%乳酸和0.3%焦亚硫酸钠pH3.8的溶液中封闭,52℃ 22-24h。然后排出液体,分别在8-9mL 100mM NaCl溶液中洗涤和匀浆。向每一试管中加入5ml的甲苯,每次用涂料混合器剧烈振动,每次6分钟,然后静置30分钟。将2ml 100mM的NCl喷到溶液上,静置30分钟,吸去蛋白-甲苯层。重复甲苯洗涤过程,加入12ml的水,在涂料振动仪上振动45秒,离心10分钟,弃去水份。重复用水洗涤,然后用12ml的丙酮进行最终洗涤。振荡和离心之后,倒掉丙酮,蒸发1小时。淀粉提取物保温在40℃的炉中,过夜。 可如下对提取的淀粉进行酶脱支。将7mg每一淀粉样品加入到含有1.1ml水的螺帽试管中,将试管加热到120℃,30分钟,然后放于45℃水浴中。脱支溶液的制备是稀释成50μl/ml异淀粉酶(5×10单位/ml;Sigma)的50mM NaOA2缓冲液,pH4.5每一淀粉样品中加入40μl的脱支溶液,在45℃水浴中将样品培养3h。通过将样品加热到110℃加垫5分钟来终止脱支反应。然后把脱支的淀粉样品冻干,再溶于DMSO。
19
6
98804784.5说 明 书 第17/35页
然后用凝胶渗透色谱法(GPC)来分析每一种脱支淀粉,每种100μl。注入100μl的每种脱支淀粉,通过过两个按序顺排列的GPC柱(Mixed Bed-C;Polymer Labs)进行层析。层析在100℃进行,用DMSO洗脱样品,流率为1.0mL/min。每隔25分钟收集样品。可用一折光指数检测仪(Waters)进行检测,在计算机运行的Chemstation软件(Version.A02.05;Hewlett-Packard)的帮助下收集和贮藏数据。 所收集样品的保留时间可与支链淀粉标准品的保留时间(380K,100K,23.7K,5.8K,728和180mw)进行比较。测定的总淀粉的比率为跨距色谱较中直链淀粉和支链淀粉部分的聚合度(DP)的24个范围。适宜DP范围中的百分率面积用于确定色谱图中支链淀粉部分A&B1,B2,B3和B4链的值。DP150之上的总面积的比例用于测定支链淀粉的含量。
经典地,用分子中支链的分布来对支链淀粉进行描述。支链淀粉分子包括变更的晶状区和非晶形区。晶形区是许多分支点(α-1,6连接)发生的地方,而非晶形区是一个少到没有分支和几个分支链的区域。链的类型可设计为A或B。A链是未分支的,跨距单个的晶形区。B1链也跨距一单个晶形区,但是分支。B2,B3和B4链是分支的且分别跨距2,3和4或更多个晶形区(Hizukuri(1986),糖研究147:342-347)。色谱图中支链淀粉部分以下的相对区域用于确定A&B1,B2,B3和B4链的面积百分比。
来自转化了嵌合基因的植物果仁的淀粉也可应用本领域的技术人员熟知的技术进行功能测定。例如,可从转化植物的干燥或熟果仁中提取淀粉。称15g果仁放到50ml的锥形瓶中,在50ml浸泡溶液(同上)中52℃浸泡18h。弃液用水洗涤果仁,然后用一20mM的Polytron探针(Kintmatica GmbH;Kriensluzern,瑞典)在50ml冷50mM NaCl液中搅拌。匀浆通过72微粒筛网进行过滤。滤液的总体积用50mMNaCl加到400ml,加入同体积的甲苯。用磁力棒以能彻底乳化两相的有效,过度搅拌1小时。乳液在一封盖的烧杯中分离,过夜。从烧杯中吸去上面甲苯层,弃之。将保留在烧杯底部的淀粉浆重悬,倒入到250mL的离心瓶中,25000RCF离心15分钟。弃上清液,依次用水和丙酮如上经振荡和离心进行洗涤。用丙酮洗涤和离心之后弃丙酮,淀粉在通风厨中室温过夜,干燥。
20
+
+
98804784.5说 明 书 第18/35页
可用具有高灵敏度选择和Thermocline软件的Rapid viscoAnalyzer(Newport Scientific;Sydney;Australia)进行粘度曲线分析。每一排均是称1.5g淀粉放到样品杯,加入25ml含有1%NaCl的磷酸盐/柠檬酸缓冲液(pH6.50)。粘度曲线分析应用下面的温度流程进行:无效温度50℃,在50℃放置0.5分钟,直线加温到95℃,2.5分钟,直线降温到50℃过4分钟,50℃放置4分钟。
Rapid visco Analyzer粘度分析的结果证明由转染了嵌合基因的品系所产生的淀粉,其粘度特征不同于通常的压缩淀粉。该结果也证明通过改变玉米支链淀粉酶的表达来诱导淀粉精细结构的改变可生产一种有新功能的淀粉。
实施例4
嵌合基因在微生物细胞中的表达
可以把玉米支链淀粉酶插入到T7 E.Coli的表达载体pET24d(Novagen)。包含该玉米支链淀粉酶cDNA质粒DNA经适当的消化后可释放编码玉米支链淀粉酶的核苷酸片段。然后该片段可在1%NuSieveGTG低熔点琼脂糖胶上(FMC)进行纯化。缓冲液和琼脂糖中包含10μg/ml的溴化乙锭以利于DNA片段的观察。从琼脂糖胶中得到的片段可这样纯化:按照商家的说明用GELase(EpicentreTechnologies)进行消化,乙醇沉淀,干燥,重悬于20μl水中。可用T4 DNA连接酶(NEB)将适宜的寡核苷酸接头连到玉米支链淀粉酶片段上。可应用上述的低熔点琼脂糖从过剩的接头中纯化包含有连接的接头的玉米支链淀粉酶片段。按上面所述,消化载体pEt24d,用碱性磷酸酶(NEB)脱磷酸化,用酚/氯仿脱蛋白。然后所制备的载体pET24d与玉米支链淀粉酶片段在16℃连接15h,随后转化到DH5电潜能细胞(GIBCO BRL)。可在含有2×YT介质和50μg/ml卡那霉素的琼脂
板中选择转化体。然后通过性酶分析就可筛选出包含玉米支链淀粉酶基因的转化体,因为对pET24d T7启动子有正确的定位。 将与T7启动子有正确定位的克隆转化到BL21((DE3)细胞(Novagen),然后在含有50μg/ml卡那霉素的2×YT琼脂板上选择。来自该转化体结构的克隆可在含50μg/ml卡那霉素的2×YT培养基上30℃过夜生长。然后用新鲜培养基稀释2倍,再新生长1h,然后加入终
21
TM
98804784.5说 明 书 第19/35页
浓度为1mM的异丙基硫代吡喃半乳糖苷。3h后离心,收集细胞,重悬于50μl含0.1mM DTT和0.2mM苯甲基磺酰氟的50mM Tris-HCl,pH8.0中。加入少量的1mm玻璃珠,用微探针声处理仪将混合
物进行声波处理,处理3次,每次约5秒。将混合物离心确定其中蛋白质的浓度。用SDS-聚丙酰胺凝胶电泳可从培养物的可溶性部分分离出1μg的蛋白质。从胶中可观察到,因为蛋白带迁移到期望的分子重量处。
22
98804784.5说 明 书 第20/35页
序列表(1)一般信息: (i)申请人
(A)名称:纳幕尔杜邦公司 (B)街道:市场路1007 (C)城市:威尔明顿 (D)州:特拉华州 (E)国家:美国 (F)邮区:198 (G)电话:302-992-4926 (H)电传:302-773-01 (I)电报:0717325
(ii)TITLE OF INVENTION:CORN PULLULANASE (iii)序列数:8 (iv)计算机可读形式: (A)介质类型:3.50吋磁盘 (B)计算机:IBM PC可容 (C)操作系统:微软视窗95
(D)软件:Word 7.0(用于Windows 95) (v)当前申请数据: (A)申请号: (B)申请日期: (C)分类: (vi)在先申请数据: (A)申请号:60/045,723 (B)申请日:1997年5月6日 (vii)代理人/代理机构信息: (A)姓名:MAJARIAN,WILLIAN R. (B)登记号:41,173 (C)参考/文档号:BB-1108
23
98804784.5说 明 书 第21/35页
(2)SEQ ID NO:1信息 (i)序列特征: (A)长度:624bp (B)类型:核苷酸 (C)链:单 (D)拓扑学:线性 (ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:1:
CTCAGAAGGG ACTCTAATGG TCAGACTGAG AACAGCGCGG CTGTGAACAA TACAGCAAGT GAGCATTTCA TGGTTGATAG ATTAATCGTG GATGACCTTC TGAATTGGGC AGTAAATTAC AAAGTTGACG GGTTCAGATT TGATCTAATG GGACATATCA TGAAAAAGAC AATGATTAGA GCAAAATCGG CTCTTCAAAG CCTTACAATT GATGAACATG GAGTAGATGG TTCAAAGATA TACTTGTATG GTGAAGGATG GAACTTCGGT GAAGTTGCGG AAAATCAACG TGGGATAAAT GGATCCCAGC TAAAAATGAG TGGCACTGGG ATTGGTAGTT TCAACGATAG AATCCGTGAT GCTATAAATG GTGGCAGTCC GTTTGGGAAT CCACTGCAAC AAGGTTTCTC TACTGGATTG TTCTTAGAGC CAAATGGATT TTATCAGGGC AATGAAACAG AGACAAGGCT CACGCTTGCT ACATACGCTG ACCATATACA GATTGGATTA GCTGGCAATT TGAAGGACTA TGTAGTTATA TCTCATACTG GAGAAGCTAG AAAANGATCT GAAATTTCGC ACCTTCGATG GCTCACCAGT TNGGCTATGC TTCATCCCCT ATAN (2)SEQ ID NO:2信息 (i)序列特征: (A)长度:208bp (B)类型:核苷酸 (C)链:单 (D)拓扑学:线性 (ii)分子类型:肽
(xi)序列描述:SEQ ID NO:2:
24
601201802403003604204800600624 98804784.5说 明 书 第22/35页
Leu Arg Arg Asp Ser Asn Gly Gln Thr Glu Asn Ser Ala Ala Val Asn1 5 10 15Asn Thr Ala Ser Glu His Phe Met Val Asp Arg Leu Ile Val Asp Asp 20 25 30
Leu Leu Asn Trp Ala Val Asn Tyr Lys Val Asp Gly Phe Arg Phe Asp 35 40 45
Leu Met Gly His Ile Met Lys Lys Thr Met Ile Arg Ala Lys Ser Ala 50 55 60
Leu Gln Ser Leu Thr Ile Asp Glu His Gly Val Asp Gly Ser Lys Ile65 70 75 80Tyr Leu Tyr Gly Glu Gly Trp Asn Phe Gly Glu Val Ala Glu Asn Gln 85 90 95Arg Gly Ile Asn Gly Ser Gln Leu Lys Met Ser Gly Thr Gly Ile Gly 100 105 110
Ser Phe Asn Asp Arg Ile Arg Asp Ala Ile Asn Gly Gly Ser Pro Phe 115 120 125
Gly Asn Pro Leu Gln Gln Gly Phe Ser Thr Gly Leu Phe Leu Glu Pro 130 135 140
Asn Gly Phe Tyr Gln Gly Asn Glu Thr Glu Thr Arg Leu Thr Leu Ala145 150 155 160Thr Tyr Ala Asp His Ile Gln Ile Gly Leu Ala Gly Asn Leu Lys Asp 165 170 175Tyr Val Val Ile Ser His Thr Gly Glu Ala Arg Lys Xaa Ser Glu Ile 180 185 190
Ser His Leu Arg Trp Leu Thr Ser Xaa Ala Met Leu His Pro Leu Xaa 195 200 205(2)SEQ ID NO:3信息 (i)序列特征: (A)长度:484bp (B)类型:核苷酸 (C)链:单 (D)拓扑学:线性 (ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:3:
25
98804784.5说 明 书 第23/35页
CCTTAGACAA ATTTATTGAT ATCCTCAAGA TCAGATACTC ATCACCTCTC TTTCGCCTAA 60CTACAGCAAG TGATATTGTG CAAAGGGTTC ACTTTCACAA CACAGGGCCC TCCTTGGTTC 120CAGGAGTTAT TGTCATGAGC ATCGAAGATN ANCGAAATGA TAGGCATGAT ATGGCCCAGA 180TAGATGAAAC ATTCTCTTGT GTCGTTACAG TCTTCAATGT ATGTCCGTAC GAAGTGTCTA 240TAGAAATCCC TGATCTTGCA TCACTGCGGC TTCAGTTGCA TCCAGTGCAG GTGAATTCAT 300CGGATGCGTT AGCCAGGCAG TCTGCGTACG ACACCGCCAC AGGTCGATTC ACCGTGCCGA 360AAAGGACAGC AGCAGTGTTC GTGGAACCCA GGTGCTGATG GATGCCTTTC GCTAGCGAGC 420AAGTGCATTC GGCATCCAAG TCGAAGCAAA CGAATGANAT AAGAGAAGGC CATCGAATAA 480AACG (2)SEQ ID NO:4信息 (i)序列特征: (A)长度:131bp (B)类型:核苷酸 (C)链:单 (D)拓扑学:线性 (ii)分子类型:肽
(xi)序列描述:SEQ ID NO:4:
Leu Asp Lys Phe Ile Asp Ile Leu Lys Ile Arg Tyr Ser Ser Pro Leu1 5 10 15Phe Arg Leu Thr Thr Ala Ser Asp Ile Val Gln Arg Val His Phe His 20 25 30
Asn Thr Gly Pro Ser Leu Val Pro Gly Val Ile Val Met Ser Ile Glu 35 40 45
Asp Xaa Arg Asn Asp Arg His Asp Met Ala Gln Ile Asp Glu Thr Phe 50 55 60
Ser Cys Val Val Thr Val Phe Asn Val Cys Pro Tyr Glu Val Ser Ile65 70 75 80Glu Ile Pro Asp Leu Ala Ser Leu Arg Leu Gln Leu His Pro Val Gln 85 90 95Val Asn Ser Ser Asp Ala Leu Ala Arg Gln Ser Ala Tyr Asp Thr Ala 100 105 110
Thr Gly Arg Phe Thr Val Pro Lys Arg Thr Ala Ala Val Phe Val Glu 115 120 125Pro Arg Cys 130
26
484 98804784.5说 明 书 第24/35页
(2)SEQ ID NO:5信息 (i)序列特征: (A)长度:986bp (B)类型:核苷酸 (C)链:单 (D)拓扑学:线性 (ii)分子类型:肽
(xi)序列描述:SEQ ID NO:5:
Met Gln Met Leu Leu His Ala Asn Ser Leu Leu Leu Leu Ala Pro Thr1 5 10 15Thr Ser Arg Leu Ser Ala Ser Ala Ser Pro Gly Arg Ser Gly Thr Ala 20 25 30
Arg Pro Leu Pro Pro Pro Gln Gly Thr Arg Ile Pro Pro Ala Pro Pro 35 40 45
Leu Ala Gly His Gly Gly Arg Pro Pro Ser Pro Gln Pro Arg Arg Gly 50 55 60
Arg Asp Gly Val Gly Glu Glu Cys Ala Ala Ala Val Ala Ser Gln Gly65 70 75 80Phe Val Thr Asp Ala Arg Ala Tyr Trp Val Thr Arg Ser Leu Ile Ala 85 90 95Trp Asn Val Asn Asp Gln Asp Thr Ser Leu Phe Leu Tyr Ala Ser Arg 100 105 110
Asp Ala Thr Met His Val Ser Asp Gly Ala Ile His Gly Tyr Asp Ser 115 120 125
Lys Ile Glu Leu Glu Pro Glu His Ala Ser Leu Pro Asp Asn Val Ala 130 135 140
Glu Lys Phe Pro Phe Ile Arg Ser Tyr Arg Thr Phe Arg Val Pro Ser145 150 155 160Ser Val Asp Val Ala Ser Leu Val Lys Cys Gln Leu Ala Val Ala Ser 165 170 175Tyr Asp Ala His Gly Arg His Gln Asp Val Thr Gly Leu Gln Leu Pro 180 185 190
Gly Val Leu Asp Asp Met Phe Ala Tyr Thr Gly Pro Leu Gly Ala Val 195 200 205
Phe Ser Asp Lys Asp Val Asp Leu Tyr Leu Trp Ala Pro Thr Ala Gln 210 215 220
27
98804784.5说 明 书 第25/35页
Asp Val Arg Val Cys Phe Tyr Asp Gly Pro Ala Gly Pro Leu Leu Gln225 230 235 240Thr Val Gln Leu Lys Glu Leu Asn Gly Val Trp Ser Val Thr Val Pro 245 250 255Arg Tyr Pro Glu Asn Gln Tyr Tyr Leu Tyr Glu Val Lys Val Tyr His 260 265 270
Pro Ser Thr Ser Gln Val Glu Lys Cys Leu Ala Asp Asp Pro Tyr Ala 275 280 285
Arg Gly Leu Ser Ala Asn Gly Thr Arg Thr Trp Leu Val Asp Ile Asn 290 295 300
Ser Glu Thr Leu Lys Pro Ala Ser Trp Asp Glu Leu Ser Asp Glu Glu305 310 315 320Pro Asn Leu Glu Ser Phe Ser Asp Ile Ser Ile Tyr Glu Leu His Ile 325 330 335Arg Asp Phe Ser Ala His Asp Ser Thr Val Asp Cys Asn Ser Arg Gly 340 345 350
Gly Phe Val His Leu His Phe Arg Leu Phe Arg Leu Asn Leu Leu Asn 355 360 365
Asp Phe Cys Ser Pro Pro Ile Thr Lys His Pro Gly Arg Ile Met Glu 370 375 380
Thr Val Met Gln Asp Ser Ala Gly Ile Arg His Leu Arg Lys Leu Ser385 390 395 400Ala Ala Gly Leu Thr His Val His Leu Leu Pro Ser Phe His Phe Ala 405 410 415Ser Val Asp Asp Asn Lys Ser Asn Trp Lys Phe Val Asp Glu Ala Gln 420 425 430
Leu Ala Lys Leu Pro Pro Gly Ser Asp Glu Gln Gln Ala Ala Ile Val 435 440 445
Ser Ile Gln Gln Glu Asp Pro Tyr Asn Trp Gly Tyr Asp Pro Val Leu 450 455 460
Trp Gly Val Pro Lys Gly Ser Tyr Ala Ser Asn Pro Asp Gly Pro Ser465 470 475 480Arg Ile Ile Glu Tyr Arg Gln Met Val Gln Ala Leu Asn Arg Ile Gly 485 490 495Leu Arg Val Val Met Asp Val Val Tyr Asn His Leu Asp Ser Ser Gly 500 505 510
Pro Phe Gly Val Ser Ser Val Leu Asp Lys Ile Val Pro Gly Tyr Tyr 515 520 525
28
98804784.5说 明 书 第26/35页
Leu Arg Arg Asn Val Asn Gly Gln Ile Glu Asn Ser Ala Ala Met Asn 530 535 0
Asn Thr Ala Ser Glu His Phe Met Val Asp Arg Leu Thr Val Asp Asp5 550 555 560Leu Leu Asn Trp Ala Ile Asn Tyr Lys Val Asp Gly Phe Arg Phe Asp 565 570 575Leu Met Gly His Ile Met Lys Ser Thr Met Ile Arg Ala Lys Ser Ala 580 585 590
Ile Arg Ser Leu Thr Arg Asp Val His Gly Val Tyr Gly Ser Lys Ile 595 600 605
Tyr Leu Tyr Gly Glu Gly Trp Asp Phe Gly Glu Val Ala Gln Asn Lys 610 615 620
Arg Gly Ile Asn Ala Ser Gln Ile Asn Met Ser Gly Thr Gly Ile Gly625 630 635 0Ser Phe Asn Asp Arg Ile Arg Asp Ser Val Asn Gly Gly Asn Pro Phe 5 650 655Gly Asn Pro Leu Gln Gln Gly Phe Ser Thr Gly Leu Phe Leu Glu Pro 660 665 670
Asn Gly Tyr Tyr Gln Gly Asn Glu Ala Asp Thr Arg Arg Glu Leu Ala 675 680 685
Thr Tyr Ala Asp His Ile Gln Ile Gly Leu Ala Gly Asn Leu Lys Asp 690 695 700
Tyr Val Leu Arg Thr His Thr Gly Glu Ala Lys Lys Gly Ser Asp Ile705 710 715 720Tyr Thr Phe Asp Gly Ser Pro Val Gly Tyr Thr Ser Ser Pro Val Glu 725 730 735Thr Ile Asn Tyr Val Ser Ala His Asp Asn Glu Thr Leu Phe Asp Ile 740 745 750
Val Ser Ile Lys Thr Pro Ile Gly Leu Ser Ile Asp Gly Glu Cys Arg 755 760 765
Ile Asn His Leu Ala Ser Ser Met Ile Ala Leu Set Gln Gly Ile Pro 770 775 780
Phe Phe His Ala Gly Asp Glu Ile Leu Arg Ser Lys Ser Leu Asp Arg785 790 795 800Asp Ser Tyr Asn Ser Gly Asp Trp Phe Lys Lys Leu Asp Leu His Met 805 810 815Asn Gln Pro Ile Gly Cys Arg Leu Leu Gln Glu Ile Arg Met Lys Asn 820 825 830
29
98804784.5说 明 书 第27/35页
Met His Leu Ile Lys Pro Arg Leu Glu Asn Pro Ser Phe Arg Pro Leu 835 840 845
Lys Asn His Ile Leu Ser Cys Phe Asp Asn Phe Val Asp Ile Leu Lys 850 855 860
Ile Arg Tyr Ser Ser Pro Leu Phe Arg Leu Ser Thr Ala Ser Asp Ile865 870 875 880Glu Gln Arg Val Arg Phe His Asn Thr Gly Pro Ser Met Val Pro Gly 885 0 5Val Ile Val Met Ser Ile Lys Asp Ala Gln Asn Glu Lys Cys Lys Met 900 905 910
Ala Gln Leu Asp Lys Asn Phe Ser Tyr Val Val Thr Ile Phe Asn Val 915 920 925
Cys Pro His Glu Val Ser Ile Glu Ile His Asp Leu Ala Ser Leu Gly 930 935 940
Leu Glu Leu His Pro Ile Gln Val Asn Ser Ser Asp Ala Leu Val Arg945 950 955 960Gln Ser Ala Tyr Glu Ala Ser Lys Gly Arg Phe Thr Val Pro Arg Arg 965 970 975Thr Thr Ala Val Phe Val Gln Pro Arg Cys 980 985(2)SEQ ID NO:6信息 (i)序列特征: (A)长度:9bp (B)类型:核苷酸 (C)链:单 (D)拓扑学:线性 (ii)分子类型:肽
(xi)序列描述:SEQ ID NO:6:
Met Ser Ser Leu Tyr Asn Pro Ile Ala Leu Ala Ser Ser Phe His His1 5 10 15His Tyr Pro Asn Leu Arg Phe Leu Pro Phe Asn Phe Asn Phe Ile Thr 20 25 30
Lys Leu Pro Val Ser Asn Ser Phe Ala Ile Gly Ser Ser Ser Arg Ser 35 40 45
Phe His Ser Ser Pro Leu Lys Lys Asp Ser Ser Cys Phe Cys Cys Ser 50 55 60
30
98804784.5说 明 书 第28/35页
Met Ala Val Glu Val Gly Ser Ala Ser Ser Val Ser Gln Ser Glu Leu65 70 75 80Gln Gly Ser Leu Asn Ser Cys Arg Ala Tyr Trp Pro Ser Lys Tyr Thr 85 90 95Phe Ala Trp Asn Val Asp Ile Gly Asn Gly Ser Tyr Tyr Leu Phe Ala 100 105 110
Ser Lys Thr Ala Ala Leu Lys Phe Thr Asp Ala Gly Ile Glu Gly Tyr 115 120 125
Asp Val Lys Ile Lys Leu Asp Lys Asp Gln Gly Gly Leu Pro Ala Asn 130 135 140
Val Thr Glu Lys Phe Pro His Ile Arg Gly Tyr Ser Ala Phe Lys Ala145 150 155 160Pro Ala Thr Leu Asp Val Asp Ser Leu Leu Lys Cys Gln Leu Ala Val 165 170 175Ala Ala Phe Ser Ala Asp Gly Ala Cys Arg Asn Ala Thr Gly Leu Gln 180 185 190
Leu Pro Gly Val Ile Asp Glu Leu Tyr Ser Tyr Asp Gly Pro Leu Gly 195 200 205
Ala Val Phe Ser Glu Asn Thr Ile Ser Leu Tyr Leu Trp Ala Pro Thr 210 215 220
Ala Gln Ala Val Ser Ala Ser Ile Phe Lys Asp Pro Ser Gly Gly Glu225 230 235 240Pro Leu Gln Thr Val Gln Leu Ile Glu Ser Asn Gly Val Trp Ser Ala 245 250 255Val Gly Pro Arg Thr Trp Glu Gly Cys Tyr Tyr Val Tyr Glu Ile Thr 260 265 270
Val Tyr His His Ser Thr Leu Arg Ile Glu Lys Ser Phe Ala Ile Asp 275 280 285
Pro Tyr Ala Arg Gly Ile Ser Ala Asp Val Lys Arg Thr Leu Leu Ala 290 295 300
Asp Leu Ser Ser Glu Thr Leu Lys Pro Glu Gly Trp Glu Asn Leu Ala305 310 315 320Asp Glu Lys Pro His Leu Leu Ser Pro Ser Asp Ile Ser Leu Tyr Glu 325 330 335Leu His Ile Arg Asp Phe Ser Ala Tyr Asp Leu Thr Val His Pro Asp 340 345 350
Leu Arg Gly Gly Tyr Leu Ala Phe Thr Ser Gln Asp Ser Ala Gly Val 355 360 365
31
98804784.5说 明 书 第29/35页
Asn His Leu Glu Lys Leu Ser Ala Ala Gly Leu Thr His Val His Leu 370 375 380
Leu Pro Ser Phe Gln Phe Ala Glu Val Asp Asp Asp Lys Lys Lys Trp385 390 395 400Lys Phe Val Asp Thr Lys Arg Phe Glu Thr Leu Pro Pro Asp Ser Glu 405 410 415Glu Gln Gln Ala Gln Ile Thr Ala Ile Arg Asp Glu Asp Gly Tyr Asn 420 425 430
Trp Gly Tyr Asn Pro Val Leu Trp Gly Thr Pro Lys Gly Ser Tyr Ala 435 440 445
Thr Asp Pro Asn Gly Pro Cys Arg Ile Ile Glu Phe Arg Lys Met Val 450 455 460
Gln Ala Leu Asn Arg Ile Gly Leu Arg Val Val Leu Asp Val Val Tyr465 470 475 480Asn His Leu Asn Ser Ser Gly Pro Ser Asp Asp Asn Ser Val Leu Asp 485 490 495Lys Ile Val Pro Gly Tyr Tyr Leu Arg Arg Asp Asn Asp Gly Ala Ile 500 505 510
Glu Asn Ser Thr Cys Val Asn Asp Thr Ala Ser Glu His Phe Met Val 515 520 525
Glu Arg Leu Ile Leu Asp Asp Leu Lys His Trp Ala Val Asn Tyr Lys 530 535 0
Val Asp Gly Phe Arg Phe Asp Leu Met Gly His Ile Met Lys His Thr5 550 555 560Met Val Lys Ala Thr Asn Met Leu Gln Gly Leu Ser Lys Asn Ile Asp 565 570 575Gly Val Glu Gly Ser Ser Ile Tyr Leu Tyr Gly Glu Gly Trp Asp Phe 580 585 590
Gly Glu Val Ala Asn Asn Ala Arg Gly Val Asn Ala Ser Gln Leu Asn 595 600 605
Leu Gly Gly Thr Gly Ile Gly Ser Phe Asn Asp Arg Ile Arg Asp Ala 610 615 620
Val Leu Gly Gly Gly Pro Phe Gly Pro Pro Leu Gln Gln Gly Tyr Val625 630 635 0Thr Gly Leu Ser Leu Gln Pro Asn Asp His Asp His Ser Gly Lys Ala 5 650 655Asn Ala Asp Arg Met Leu Ala Val Ala Lys Asp His Ile Gln Val Gly 660 665 670
32
98804784.5说 明 书 第30/35页
Met Ala Gly Asn Leu Arg Asp Tyr Ile Leu Thr Asn Cys Asp Gly Lys 675 680 685
Gln Val Lys Gly Ser Glu Val Tyr Thr Tyr Gly Gly Thr Pro Val Gly 690 695 700
Tyr Ala Met Gln Pro Ile Glu Thr Ile Asn Tyr Val Ser Ala His Asp705 710 715 720Asn Glu Thr Leu Phe Asp Ile Val Ser Leu Lys Thr Pro Thr Tyr Ile 725 730 735Thr Val Asp Glu Arg Cys Arg Val Asn His Leu Ala Thr Ser Ile Leu 740 745 750
Ala Leu Ser Gln Gly Ile Pro Phe Phe His Ala Gly Asp Glu Leu Leu 755 760 765
Arg Ser Lys Ser Leu Asp Arg Asp Ser Tyr Asn Ser Gly Asp Trp Phe 770 775 780
Asn Arg Leu Asp Phe Ser Tyr Asn Ser Asn Asn Trp Gly Val Gly Leu785 790 795 800Pro Pro Lys Asp His Asn Glu Ser Asn Trp Pro Leu Ile Lys Lys Arg 805 810 815Leu Ala Asn Pro Ser Tyr Lys Pro Asp Lys Asn His Ile Ile Ala Ala 820 825 830
Val Glu Asn Phe Thr Asn Leu Leu Gln Ile Arg Tyr Ser Ser Pro Leu 835 840 845
Phe Arg Leu Arg Ser Ala Lys Asp Ile Glu Asp Arg Val Arg Phe His 850 855 860
Asn Asn Val Pro Set Trp Ile Pro Gly Leu Ile Ala Met Ser Ile Glu865 870 875 880Asp Gly His Ala Gly Ala Pro Gly Leu Ser Gln Ile Asp Pro Lys Phe 885 0 5Gln Tyr Ile Val Val Ile Ile Asn Val Gln Pro Thr Glu Thr Lys Phe 900 905 910
Val Asn Pro Asp Leu Arg Ala Lys Ser Leu Gln Leu His Pro Val Gln 915 920 925
Ser Thr Ser Gly Asp Thr Val Val Lys Glu Ser Lys Tyr Glu Pro Ser 930 935 940
Thr Gly Cys Phe Thr Ile Pro Pro Lvs Ser Thr Ala Val Phe Val Glu945 950 955 960Pro Arg His Val
33
98804784.5(2)SEQ ID NO:7信息 (i)序列特征: (A)长度:2904bp (B)类型:核苷酸 (C)链:单 (D)拓扑学:线性 (ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:7:
GTTGGATGCG AGGGCTTACT GGGTGACAAA GAAAACTTCT CTCTTCTTAT ATGCAAGCAG TATGAAAGGT TATGATTCCA AAGTTGAGCT TGTGACCCAG AAATTCCCTT TTATCAGCTC TGATGTTGCC ACCTTGGTGA AATGTCAACT CAGGCAAGAT GTTACTGGGT TGCAACTACC TGGACCGCTT GGTACTATTT CTAGTGAAGA AGCACAGGAT GTAAGTGTGA GCTTCTATGA TCAACTCAAC GAGTTAAATG GTGTTTGGAG GTATTATCTA TATGAAGTCA CAGTATATCA AGCCGCTGAT CCTTATGCTA GAGGGCTTTC TATTAATAAT GAAACATTAA AGCCACTTGC GCTTGATTCC TTCTCTGACA TAAGCATATA TGATAGCACA GTGGACTGTC CTTTCCGAGG TGTAGGCATA GAACACCTAA AGAAACTATC GCCAAGCTTT CAATTTGGTG GTGTTGATGA GATTGAACTG TCAAAACTCC CTCCAGGGTC TCAGGAAGAG GACCCTTATA ATTGGGGGTA AAGCTATGCA AGTAACCCAG ATGGTCCAAG GGCCTTGAAT CGCTTAGGTC TTCGAGTTGT AAGTGGCCCT TTTGCCATCA CTTCCGTGCT AAGGGACTCT AATGGTCAGA CTGAGAACAG ATCCTTGATT AAATGCTACA GCAACCAGAA TTATAGAGCC TGCTGTTGCT TGGAGTATTG AGCTGTGAGT TGGTCCAGCT TGTTACTGGT TCAAACTACA TGCAAATAGC CTGGGATGGA TGAATTGCAC AGGTTTCTGT TGATGCCGGT CATAAAGAGC AGATTTGCAA TAACCCTGTG TCGTATCATT CATGGATGTT TGACAAGATT CGCGGCTGTG 34
GCATGGAATA ATGTGCATGT AATGATGGAC TTCAGAATTC TCATTTGATG GATGACATGT ATGTACCTAT GGCCCTTTAC CCAAGGAACT GGAAACATTG ACACGAACTT TTGGCGGCTG ATTCGTGATT GCATTTACAT TTGACTCATG AATTGGAAAT CAAGCTGCAA GTTTGGGGCG GAGTACCGGC GTATACAATC GTACCTGGAT AACAATACAG TCAGTGATCA CGAGTCAGGA TTCCATCCAG CGAGCTCCGT CTCATGGGAA TCGCCTACAC GGGCTCCTAC TGGAAACAGT GGGAGAACCG AGAAATGTTT GGTTGGTTGA AAAAGCCAAG TCAGTGCCCA TTCAGGATTC TCCATTTGTT GTGTTGATGA TTGTGGCTAT TTCCAAAAGG TGATGGTGCA ATCTATACTC ACTACCTCAG CAAGTGAGCA 说 明 书 第31/35页
60 120 180 240 300 360 420 480 0 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320
98804784.5说 明 书 第32/35页
TTTCATGGTT GATAGATTAA TCGTGGATGA CCTTCTGAAT TGGGCAGTAA ATTACAAAGT 1380TGACGGGTTC AGATTTGATC TAATGGGACA TATCATGAAA AAGACAATGA TTAGAGCAAA 1440ATCGGCTCTT CAAAGCCTTA CAATTGATGA ACATGGAGTA GATGGTTCAA AGATATACTT 1500GTATGGTGAA GGATGGAACT TCGGTGAAGT TGCGGAAAAT CAACGTGGGA TAAATGGATC 1560CCAGCTAAAA ATGAGTGGCA CTGGGATTGG TAGTTTCAAC GATAGAATCC GTGATGCTAT 1620AAATGGTGGC AGTCCGTTTG GGAATCCACT GCAACAAGGT TTCTCTACTG GATTGTTCTT 1680AGAGCCAAAT GGATTTTATC AGGGCAATGA AACAGAGACA AGGCTCACGC TTGCTACATA CGCTGACCAT ATACAGATTG GATTAGCTGG CAATTTGAAG GACTATGTAG TTATATCTCA TACTGGAGAA GCTAGAAAAG GATCTGAAAT TCGCACCTTC GATGGCTCAC CAGTTGGCTA TGCTTCATCC CCTATAGAAA CAATAAACTA CGCCTCTGCT CATGACAATG AAACACTATT TGATATTATT AGTCTAAAGA CTCCGATGGA CCTCTCAATT GACGAGCGAT GCAGGATAAA TCATTTGTCC ACAAGCATGA TTGCATTATC CCAGGGAATA CCATTTTTTC ATGCTGGTGA TGAGATACTA CGATCTAAGT CGCTTGATCG AGATTCATAT GACTCTGGTG ATTGGTTTAA CAAGATTGAT TTTACCTATG AAACAAACAA TTGGGGTGTT GGGCTTCCAC CAAGAGAAAA GAACGAAGGG AGCTGGCCTT TGATGAAGCC AAGATTGGAG AACCCGTCGT TCAAACCTGC AAAACATGAC ATTATTGCTG CCTTAGACAA ATTTATTGAT ATCCTCAAGA TCAGATACTC ATCACCTCTC TTTCGCCTAA CTACAGCAAG TGATATTGTG CAAAGGGTTC ACTTTCACAA CACAGGGCCC TCCTTGGTTC CAGGAGTTAT TGTCATGAGC ATCGAAGATG CACGAAATGA TAGGCATGAT ATGGCCCAGA TAGATGAAAC ATTCTCTTGT GTCGTTACAG TCTTCAATGT ATGTCCGTAC GAAGTGTCTA TAGAAATCCC TGATCTTGCA TCACTGCGGC TTCAGTTGCA TCCAGTGCAG GTGAATTCAT CGGATGCGTT AGCCAGGCAG TCTGCGTACG ACACCGCCAC AGGTCGATTC ACCGTGCCGA AAAGGACAGC AGCAGTGTTC GTGGAACCCA GGTGCTGATG GATGCCTTTC GCTAGCGAGC AAGTGCATTC GGCATCCAAG TCGAAGCAAA CGAATGAAAT AAGAGAAGGC CATCGAATAA AACGAAGTAT ATAAATAGAT TGAATAAGAC GTTGCCCAAG TTGCCAAGGC ACGCTTTGCC ATATGTATGC GTTGAAAAAT AAATAAATAA ATAAATAAAT GATGTTATAG AGGTACAAAA GCATTGGAAC ATTTCTTTAT AGAGGTGAAC CACCCTATTT TCCAAAAAAA AAAAAAAAAA AAAA 35
1740180018601920198020402100216022202280234024002460252025802027002760292028802904
98804784.5说 明 书 第33/35页
(2)SEQ ID NO:8信息 (i)序列特征: (A)长度:878bp (B)类型:核苷酸 (C)链:单 (D)拓扑学:线性 (ii)分子类型:肽
(xi)序列描述:SEQ ID NO:8:
Leu Asp Ala Arg Ala Tyr Trp Val Thr Lys Ser Leu Ile Ala Trp Asn1 5 10 15Ile Ser Asp Gln Lys Thr Ser Leu Phe Leu Tyr Ala Ser Arg Asn Ala 20 25 30
Thr Met Cys Met Ser Ser Gln Asp Met Lys Gly Tyr Asp Ser Lys Val 35 40 45
Glu Leu Gln Pro Glu Asn Asp Gly Leu Pro Ser Ser Val Thr Gln Lys 50 55 60
Phe Pro Phe Ile Ser Ser Tyr Arg Ala Phe Arg Ile Pro Ser Ser Val65 70 75 80Asp Val Ala Thr Leu Val Lys Cys Gln Leu Ala Val Ala Ser Phe Asp 85 90 95Ala His Gly Asn Arg Gln Asp Val Thr Gly Leu Gln Leu Pro Gly Val 100 105 110
Leu Asp Asp Met Phe Ala Tyr Thr Gly Pro Leu Gly Thr Ile Ser Ser 115 120 125
Glu Glu Ala Val Ser Met Tyr Leu Trp Ala Pro Thr Ala Gln Asp Val 130 135 140
Ser Val Ser Phe Tyr Asp Gly Pro Ala Gly Pro Leu Leu Glu Thr Val145 150 155 160Gln Leu Asn Glu Leu Asn Gly Val Trp Ser Val Thr Gly Pro Arg Asn 165 170 175Trp Glu Asn Arg Tyr Tyr Leu Tyr Glu Val Thr Val Tyr His Gln Thr 180 185 190
Thr Gly Asn Ile Glu Lys Cys Leu Ala Ala Asp Pro Tyr Ala Arg Gly 195 200 205
Leu Ser Ala Asn Ser Thr Arg Thr Trp Leu Val Asp Ile Asn Asn Glu 210 215 220
36
98804784.5说 明 书 第34/35页
Thr Leu Lys Pro Leu Ala Trp Asp Gly Leu Ala Ala Glu Lys Pro Arg225 230 235 240Leu Asp Ser Phe Ser Asp Ile Ser Ile Tyr Glu Leu His Ile Arg Asp 245 250 255Phe Ser Ala His Asp Ser Thr Val Asp Cys Pro Phe Arg Gly Gly Phe 260 265 270
Cys Ala Phe Thr Phe Gln Asp Ser Val Gly Ile Glu His Leu Lys Lys 275 280 285
Leu Ser Asp Ala Gly Leu Thr His Val His Leu Leu Pro Ser Phe Gln 290 295 300
Phe Gly Gly Val Asp Asp Ile Lys Ser Asn Trp Lys Cys Val Asp Glu305 310 315 320Ile Glu Leu Ser Lys Leu Pro Pro Gly Ser Asp Leu Gln Gln Ala Ala 325 330 335Ile Val Ala Ile Gln Glu Glu Asp Pro Tyr Asn Trp Gly Tyr Asn Pro 340 345 350
Val Val Trp Gly Val Pro Lys Gly Ser Tyr Ala Ser Asn Pro Asp Gly 355 360 365
Pro Ser Arg Ile Ile Glu Tyr Arg Leu Met Val Gln Ala Leu Asn Arg 370 375 380
Leu Gly Leu Arg Val Val Met Asp Val Val Tyr Asn His Leu Tyr Ser385 390 395 400Ser Gly Pro Phe Ala Ile Thr Ser Val Leu Asp Lys Ile Val Pro Gly 405 410 415Tyr Tyr Leu Arg Arg Asp Ser Asn Gly Gln Thr Glu Asn Ser Ala Ala 420 425 430
Val Asn Asn Thr Ala Ser Glu His Phe Met Val Asp Arg Leu Ile Val 435 440 445
Asp Asp Leu Leu Asn Trp Ala Val Asn Tyr Lys Val Asp Gly Phe Arg 450 455 460
Phe Asp Leu Met Gly His Ile Met Lys Lys Thr Met Ile Arg Ala Lys465 470 475 480Ser Ala Leu Gln Ser Leu Thr Ile Asp Glu His Gly Val Asp Gly Ser 485 490 495Lys Ile Tyr Leu Tyr Gly Glu Gly Trp Asn Phe Gly Glu Val Ala Glu 500 505 510
Asn Gln Arg Gly Ile Asn Gly Ser Gln Leu Lys Met Ser Gly Thr Gly 515 520 525
Ile Gly Ser Phe Asn Asp Arg Ile Arg Asp Ala Ile Asn Gly Gly Ser 530 535 0
Pro Phe Gly Asn Pro Leu Gln Gln Gly Phe Ser Thr Gly Leu Phe Leu5 550 555 560Glu Pro Asn Gly Phe Tyr Gln Gly Asn Glu Thr Glu Thr Arg Leu Thr 565 570 575
37
98804784.5说 明 书 第35/35页
Leu Ala Thr Tyr Ala Asp His Ile Gln Ile Gly Leu Ala Gly Asn Leu 580 585 590
Lys Asp Tyr Val Val Ile Ser His Thr Gly Glu Ala Arg Lys Gly Ser 595 600 605
Glu Ile Arg Thr Phe Asp Gly Ser Pro Val Gly Tyr Ala Ser Ser Pro 610 615 620
Ile Glu Thr Ile Asn Tyr Ala Ser Ala His Asp Asn Glu Thr Leu Phe625 630 635 0Asp Ile Ile Ser Leu Lys Thr Pro Met Asp Leu Ser Ile Asp Glu Arg 5 650 655Cys Arg Ile Asn His Leu Ser Thr Ser Met Ile Ala Leu Ser Gln Gly 660 665 670
Ile Pro Phe Phe His Ala Gly Asp Glu Ile Leu Arg Ser Lys Ser Leu 675 680 685
Asp Arg Asp Ser Tyr Asp Ser Gly Asp Trp Phe Asn Lys Ile Asp Phe 690 695 700
Thr Tyr Glu Thr Asn Asn Trp Gly Val Gly Leu Pro Pro Arg Glu Lys705 710 715 720Asn Glu Gly Ser Trp Pro Leu Met Lys Pro Arg Leu Glu Asn Pro Ser 725 730 735Phe Lys Pro Ala Lys His Asp Ile Ile Ala Ala Leu Asp Lys Phe Ile 740 745 750
Asp Ile Leu Lys Ile Arg Tyr Ser Ser Pro Leu Phe Arg Leu Thr Thr 755 760 765
Ala Ser Asp Ile Val Gln Arg Val His Phe His Asn Thr Gly Pro Ser 770 775 780
Leu Val Pro Gly Val Ile Val Met Ser Ile Glu Asp Ala Arg Asn Asp785 790 795 800Arg His Asp Met Ala Gln Ile Asp Glu Thr Phe Ser Cys Val Val Thr 805 810 815Val Phe Asn Val Cys Pro Tyr Glu Val Ser Ile Glu Ile Pro Asp Leu 820 825 830
Ala Ser Leu Arg Leu Gln Leu His Pro Val Gln Val Asn Ser Ser Asp 835 840 845
Ala Leu Ala Arg Gln Ser Ala Tyr Asp Thr Ala Thr Gly Arg Phe Thr 850 855 860
Val Pro Lys Arg Thr Ala Ala Val Phe Val Glu Pro Arg Cys865 870 875
38
98804784.5
说 明 书 附 图
第1/1页
39
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- igbc.cn 版权所有 湘ICP备2023023988号-5
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务