技术领域
[0001]本发明涉及生物技术领域,尤其是涉及OaAn-1蛋白、编码基因及其相关生物材料的应用。
背景技术
[0002]水稻的芒是指位于水稻颖壳顶端的带有倒锯齿的针状体。野生稻具有较长的芒,而栽培稻表现出短芒,甚至无芒的性状。自然生长状态下,较长的芒有助于野生稻种子通过相关媒介进行传播和储存,有利于其自身的繁衍,同时尖刺状的芒也有助于保护种子不受捕食者的取食。然而,在栽培状态下生长的栽培稻芒过长则不利于种子的收获、加工和贮藏。四倍体野生稻Oryza alta具有生物量大、适应力强、抗逆能力强等优势,但是由于未经过人工驯化,芒长度大于4cm,不利于田间收获,同时为水稻脱壳增加难度。因此,快速驯化野生稻芒长,由长芒变为更适合人们生产实践的短芒或无芒的性状具有实用价值。
发明内容
[0003]本发明提供了OaAn-1蛋白在调控水稻芒长中的应用或在制备调控水稻芒长产品中的应用。
[0004]所述OaAn-1蛋白为如下a1)或a2)或a3)蛋白质:
[0005]a1)氨基酸序列为序列表中SEQ ID No.1或SEQ ID No.2所示蛋白质;
[0006]a2)将序列表中SEQ ID No.1或SEQ ID No.2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同生物学功能的蛋白质;
[0007]a3)与序列表中SEQ ID No.1或SEQ ID No.2限定的氨基酸序列具有80%或80%以上同一性,来源于水稻且具有相同生物学功能的蛋白质。
[0008]上文中,所述一个或几个氨基酸残基的取代和/或缺失和/或添加为不超过10个氨基酸残基的取代和/或缺失和/或添加。
[0009]本发明还提供了OaAn-1编码基因在调控水稻芒长中的应用或在制备调控水稻芒长产品中的应用,
[0010]所述OaAn-1蛋白编码基因为如下c1)或c2)或c3)或c4)所示的DNA分子:
[0011]c1)编码序列是序列表中SEQ ID No.3或SEQ ID No.4所示的DNA分子;
[0012]c2)核苷酸序列是序列表中SEQ ID No.5或SEQ ID No.6所示的DNA分子;
[0013]c3)与c1)或c2)限定的核苷酸序列具有90%或90%以上同一性,来源于水稻且编码所述OaAn-1蛋白的DNA分子;
[0014]c4)在严格条件下与c1)或c2)限定的核苷酸序列杂交,且编码所述OaAn-1蛋白的DNA分子。
[0015]本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的OaAn-1蛋白编码基因的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明所提供的核苷酸序列90%或者更高同一性的核苷酸,只要编码OaAn-1蛋白且来源于水稻,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。这里使用的术语“同一性”指与天然核酸序列的序列相似性。
[0016]本发明还提供了上述OaAn-1蛋白相关的生物材料在调控水稻芒长中的应用或在制备调控水稻芒长产品中的应用,
[0017]所述生物材料为下述C1)至C6)和D1)至D7)中的任意一种:
[0018]C1)含有所述OaAn-1蛋白编码基因的表达盒;
[0019]C2)含有所述OaAn-1蛋白编码基因的重组载体、或含有C1)所述表达盒的重组载体;
[0020]C3)含有所述OaAn-1蛋白编码基因的重组微生物、或含有C1)所述表达盒的重组微生物、或含有C2)所述重组载体的重组微生物;
[0021]C4)含有所述OaAn-1蛋白编码基因的转基因植物细胞系、或含有C1)所述表达盒的转基因植物细胞系;
[0022]C5)含有所述OaAn-1蛋白编码基因的转基因植物组织、或含有C1)所述表达盒的转基因植物组织;
[0023]C6)含有所述OaAn-1蛋白编码基因的转基因植物器官、或含有C1)所述表达盒的转基因植物器官;
[0024]D1)抑制或降低所述OaAn-1蛋白编码基因表达的核酸分子;
[0025]D2)含有D1)所述核酸分子的表达盒;
[0026]D3)含有D1)所述核酸分子的重组载体、或含有D2)所述表达盒的重组载体;
[0027]D4)含有D1)所述核酸分子的重组微生物、或含有D2)所述表达盒的重组微生物、或含有D3)所述重组载体的重组微生物;
[0028]D5)含有D1)所述核酸分子的转基因植物细胞系、或含有D2)所述表达盒的转基因植物细胞系;
[0029]D6)含有D1)所述核酸分子的转基因植物组织、或含有D2)所述表达盒的转基因植物组织;
[0030]D7)含有D1)所述核酸分子的转基因植物器官、或含有D2)所述表达盒的转基因植物器官。
[0031]本发明还提供了一种缩短水稻芒长的方法,包括降低水稻中上述OaAn-1蛋白的含量和/或活性和/或降低或抑制水稻中上述OaAn-1蛋白编码基因的表达量,从而使水稻的芒长缩短。
[0032]上述降低或抑制水稻中上述OaAn-1蛋白编码基因的表达量可采用现有技术中的任何方式实现,以使基因产生缺失突变、插入突变或碱基变换突变,进而实现基因功能降低或丧失,具体可以采取化学诱变、物理诱变、RNAi、基因组定点编辑、同源重组等方法。无论采取哪种方法,既可对OaAn-1蛋白的整个编码基因作为靶标,又可将调控OaAn-1基因表达的各个元件作为靶标,只要能实现基因功能丧失或降低即可。如可以将OaAn-1的编码基因的外显子作为靶标。
[0033]上述基因组定点编辑方法中,可采用锌指核酸酶(Zinc finger nuclease,ZFN)技术、类转录激活因子效应物核酸酶(Transcription activator-like effector nuclease,TALEN)技术或成簇的规律间隔的短回文重复序列及其相关系统(Clustered regularlyinterspaced short palindromic repeats/CRISPR associated,CRISPR/Cas9 system)技术,以及其它能实现基因组定点编辑的技术。
[0034]可选地,根据上述方法,包括向所述水稻中导入降低或抑制所述OaAn-1蛋白编码基因表达的物质。
[0035]例如,向所述水稻中导入表达特异于靶标片段的核酸酶(即所述降低或抑制所述OaAn-1蛋白编码基因表达的物质),在核酸酶的作用下,所述靶标片段被剪切,再通过水稻的自身DNA修复,完成对所述靶标片段的定点改造,进而实现使OaAn-1蛋白的编码基因功能降低或丧失。
[0036]上述方法中,在水稻中表达特异于靶标片段的核酸酶的方法可为:直接向水稻中导入核酸酶或导入用于表达所述核酸酶的遗传物质。其中的遗传物质为DNA质粒或DNA线性片段或体外转录的RNA。核酸酶指进行定点编辑的活性功能物质。
[0037]上述在水稻中表达特异于靶标片段的核酸酶的方法中还可包括如下步骤:将导入所述核酸酶或所述遗传物质后的水稻在潮霉素选择压力的情况下种植生长。
[0038]可选地,当使用CRISPR/Cas9方法时,所述遗传物质为能转录向导RNA和表达Cas9蛋白的重组载体或DNA线性片段;或所述遗传物质由能转录向导RNA的重组载体或DNA线性片段(或分别转录crRNA和tracrRNA的两个重组载体或DNA线性片段),以及能表达Cas9蛋白的重组载体或DNA线性片段或RNA组成;或所述遗传物质由向导RNA,以及能表达Cas9蛋白的重组载体或DNA线性片段或RNA组成;所述向导RNA为由crRNA和tracrRNA通过部分碱基配对结合而成的具有回文结构的RNA;所述crRNA含有能够与所述靶标片段互补结合的RNA片段。在所述重组载体中,启动所述向导RNA的编码核苷酸序列转录的启动子可为OsU3启动子或者OsU6a启动子。
[0039]可选地,当使用TALEN核酸酶时,所述用于表达特异于所述靶标片段的核酸酶的遗传物质可为同时表达成对TALEN蛋白的重组质粒,或同时表达成对TALEN蛋白的DNA线性片段;或同时表达成对TALEN蛋白的RNA;所述TALEN蛋白由能够识别所述靶标片段并与其结合的DNA结合域和Fok I结构域组成;
[0040]可选地,当使用锌指核酸酶时,所述用于表达特异于所述靶标片段的核酸酶的遗传物质可为同时表达成对ZFN蛋白的重组质粒,或同时表达成对ZFN蛋白的DNA线性片段;或同时表达成对ZFN蛋白的RNA;所述ZFN蛋白由能够识别所述靶标片段并与其结合的DNA结合域和FokI结构域组成。
[0041]可选地,根据上述的方法,所述降低或抑制所述OaAn-1蛋白编码基因表达的物质为上述生物材料D1)-D4)中的任意一种。
[0042]可选地,根据上述的方法,D1)所述的核酸分子为表达靶向所述OaAn-1蛋白编码基因的gRNA的DNA分子或靶向所述OaAn-1蛋白编码基因的gRNA;所述靶向所述OaAn-1蛋白编码基因的gRNA的靶序列如SEQ ID No.7和/或SEQ ID No.8所示。则可以通过CRISPR/Cas9方法对OaAn-1蛋白编码基因进行定点编辑,使植物中的OaAn-1蛋白编码基因的表达量降低或被抑制,例如将表达Cas9蛋白和gRNA的重组质粒载体通过农杆菌的侵染实现外源基因向植物细胞的转移和整合,具体可使用下述实施例中制备的重组质粒CRISPR-OaAn-1-2Target。
[0043]该CRISPR-OaAn-1-2Target按照如下方法制备:将设计的靶点引物通过融合PCR的方法分别构建到中间载体pYLsgRNA-OsU3、pYLsgRNA-OsU6a,,然后通过“金门克隆”的方法将片段与pYLCRISPR/Cas9Pubi-H载体骨架相连,得到重组载体,记作CRISPR-OaAn-1-2Target。
[0044]可选地,根据上述的方法,所述降低植物中OaAn-1蛋白的含量和/或活性和/或降低或抑制植物中所述OaAn-1蛋白编码基因的表达量的方法为将水稻基因组中的SEQ IDNo.5或SEQ ID No.6所示的所述OaAn-1蛋白编码基因进行下述至少一种突变:
[0045]1)在水稻基因组中的SEQ ID No.5所示的所述OaAn-1蛋白编码基因的靶点SEQ IDNo.8中第17至18位核苷酸之间插入一个核苷酸T,或缺失一个G;
[0046]2)在水稻基因组中的SEQ ID No.6所示的所述OaAn-1蛋白编码基因的靶点SEQ IDNo.7中第17至18位核苷酸之间插入一个核苷酸T或插入一个核苷酸A和/或靶点SEQ IDNo.8中第17至18位核苷酸之间插入一个核苷酸T或缺失一个G。
[0047]上述方法适用于任何水稻,只有含有上述靶序列即可,本发明列举的例子为高秆野生稻(Oryza alta,CCDD,2n=4x=48)。
[0048]由于高秆野生稻为四倍体植物,因而上述方法为改造后得到的水稻可以是所有染色单体均被定点编辑的水稻,也可以是部分染色单体被定点编辑的水稻,该方法设计了2个靶点,任一一个靶点发挥作用,均可实现芒长缩短。
[0049]上述的OaAn-1蛋白、上述OaAn-1蛋白编码基因、上述与OaAn-1蛋白相关的生物材料也属于本发明的保护范围之内。
[0050]本发明具体实施例通过基因组编辑技术同时敲除OaAn-1蛋白编码基因OaAn-1-CC和OaAn-1-DD,得到芒长明显变短的水稻。
附图说明
[0051]图1为O.alta中OaAn-1靶点的设计图
[0052]图2为pYLCRISPR/Cas9Pubi-H载体部分骨架图和双靶点结构示意图。
[0053]图3为实施例1中构建质粒CRISPR-OaAn-1-2Target中第二轮PCR扩增表达盒电泳图。
[0054]图4为实施例1中构建质粒CRISPR-OaAn-1-2Target中菌液PCR电泳图,箭头处条带为目的条带。
[0055]图5为实施例1部分T0代转化苗扩增OaAn-1-CC和OaAn-1-DD的扩增结果,其中,泳道1-12分别为T0代转化苗的扩增结果。
[0056]图6为实施例1部分阳性编辑苗的测序结果。
[0057]图7为实施例2部分阳性编辑苗和野生型芒长比较。
[0058]图8为实施例2部分阳性编辑苗和野生型芒长(Awn length)数据统计,数据取平均值±标准差,**代表显著性分析结果为P<0.01。
具体实施方式
[0059]下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
[0060]下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0061]表达载体pYLsgRNA-OsU3、pYLsgRNA-OsU6a、双元载体pYLCRISPR/Cas9Pubi-H、CRISPR敲除载体构建方法在文献“Ma,X.,et al.A robust CRISPR/Cas9 system forconvenient.high-efficiency multiplex genome editing in monocot and dicotplants.Molecular Plant 8,1274-1284.(2015).”中公开过,公众可从中国科学院遗传与发育生物学研究所获得。
[0062]下述实施例中的四倍体野生稻为野生稻Oryza alta 2007-24,即为文献1中第906页左栏1.1中的高秆野生稻种质材料(O.alta Swallen,染色体组为CCDD,编号为YD-7900),公众可从中国科学院遗传与发育生物学研究所或国家种质南宁野生稻圃获得。文献1:梁云涛等,高秆野生稻愈伤组织诱导分化研究,西南农业学报,2014,27(3),905-909。
[0063]四倍体野生稻Oryza alta为异源四倍体,大部分基因在CC和DD亚基因组上都有拷贝。通过比对分析,Oryza alta中存在两个An-1的同源基因,位于CC亚基因组4号染色体上的基因命名为OaAn-1-CC,另一位于DD亚基因组4号染色体上的基因命名为OaAn-1-DD。OaAn-1-CC的序列如SEQ ID No.5所示,其编码的OaAn-1蛋白的氨基酸序列如SEQ ID No.1所示,该OaAn-1蛋白的CDS如SEQ ID No.3所示。OaAn-1-DD的序列如SEQ ID No.6所示,其编码的OaAn-1蛋白的氨基酸序列如SEQ ID No.2所示,该OaAn-1蛋白的CDS如SEQ ID No.4所示。
[0064]实施例1、敲除水稻中OaAn-1蛋白编码基因缩短水稻芒长
[0065]1、敲除水稻中OaAn-1蛋白编码基因构建阳性编辑苗
[0066]将质粒CRISPR-OaAn-1-2Target通过电激方法转化农杆菌EHA105,利用重组农杆菌侵染四倍体野生稻的愈伤组织,然后依次进行抗性筛选、分化再生、生根培养得到T0代转化苗。
[0067]设计OaAn-1在CC和DD亚基因组上的特异引物,将得到的T0代转化苗用特异引物扩增OaAn-1-CC和OaAn-1-DD(如
图5),然后再进行测序确定突变类型,将含有突变的T0代转化苗命名为阳性编辑苗。
图6为阳性编辑苗T0-1和T0-2的突变类型,具体为T0-1中,OaAn-1-CC在靶点2处纯合插入一个T,OaAn-1-DD移码突变(在靶点1处纯合插入一个A,靶点2处纯合插入一个T)。T0-2中,OaAn-1-CC发生双等位突变(一条染色体插入一个T,一条染色体缺失一个G),OaAn-1-DD移码突变(在靶点1处纯合插入一个T,靶点2处纯合缺失一个G),造成OaAn-1蛋白功能丧失。
[0068]用于扩增OaAn-1-CC的引物对如下
[0069]OaAn-1-CC-F:5’-CGGTACCATACTCCGACCAC-3’
[0070]OaAn-1-CC-R:5’-TGGCACGAGCGACTGCAGCA-3’
[0071]用于扩增OaAn-1-DD的引物对如下
[0072]OaAn-1-DD-F:5’-AACAAACACTGCTCCGGCCAC-3’
[0073]OaAn-1-DD-R:5’-TGGCACGAGCGAGTGGAGAA-3’
[0074]质粒CRISPR-OaAn-1-2Target通过如下方法制备。
[0075]一、靶序列的设计
[0076]在OaAn-1-CC和OaAn-1-DD第一个外显子保守区域设计靶点。
[0077]靶序列(即靶点)如下:
[0078]Target site 1∶5’-CCGAAGCGGTCCAAGGTCGC-3’(PAM为CGG,SEQ ID No.7,对应于SEQ ID No.6的第996-1015位)
[0079]Target site 2:5’-ACATCCATGTGAGGGCGAGG-3’(PAM为AGG,SEQ ID No.8,对应于SEQ ID No.5的第1016-1035位,对应于SEQ ID No.6的第1087-1106位)
[0080]二、gRNA的设计
[0081]根据上述靶序列,设计gRNA。
[0082]三、重组质粒的构建
[0083]合成下述带有接头序列(下划线部分)的单链引物:
[0084]U3-OaAn-1-F:5’-CCGAAGCGGTCCAAGGTCGC
GTTTTAGAGCTAGAAAT-3’
[0085]U3-OaAn-1-R:5’-GCGACCTTGGACCGCTTCGG
TGCCACGGATCATCTGC-3’
[0086]U6a-OaAn-1-F:5’-ACATCCATGTGAGGGCGAGG
GTTTTAGAGCTAGAAAT-3’
[0087]U6a-OaAn-1-R:5’-CCTCGCCCTCACATGGATGT
CGGCAGCCAAGCCAGCA-3’
[0088]合成构建载体的单链引物:
[0089]U-F:5’-CTCCGTTTTACCTGTGGAATCG-3’
[0090]gRNA-R:5’-CGGAGGAAAATTCCATCCAC-3’
[0091]以U-F、gRNA-R、U3-OaAn-1-F、U3-OaAn-1-R为引物,以pYLsgRNA-OsU3质粒为模板做融合PCR扩增出pOsU3-OaAn-1gRNA表达盒。以U-F、gRNA-R、U6a-OaAn-1-F、U6a-OaAn-1-R为引物,以pYLsgRNA-OsU6a质粒为模板做融合PCR扩增出pOsU6a-OaAn-1gRNA表达盒。将PCR产物进行稀释10倍,作为第二轮PCR扩增模板。
[0092]合成第二轮PCR扩增引物:
[0093]B-L:5’-TTCAGA
GGTCTCTCTCGACTAGTATGGAATCGGCAGCAAAGG-3’
[0094]B2:5’-AGCGTG
GGTCTCGTCAGGGTCCATCCACTCCAAGCTC-3’
[0095]B2’:5’-TTCAGA
GGTCTCTCTGACACTGGAATCGGCAGCAAAGG-3’
[0096]B-R:5’-AGCGTG
GGTCTCGACCGACGCGTATCCATCCACTCCAAGCTC-3’
[0097]以B-L、B2为引物,以pOsU3-OaAn-1gRNA表达盒为模板进行第二轮PCR扩增。以B2’、B-R为引物,以pOs6a-OaAn-1gRNA表达盒为模板进行第二轮PCR扩增。扩增产物进行琼脂糖凝胶电泳检测,分别回收片段大小为的564bp和629bp的目的条带,如
图2。进行纯化回收。将第二轮纯化产物按照常规分子实验操作“边切边连”的方法构建到pYLCRISPR/Cas9Pubi-H(限制性内切酶为BsaI,连接酶为T4 ligase)。转化DH5α中,挑取单克隆,进行菌液PCR,选取条带大小为1.2kb左右的阳性单克隆进行测序确定(
图3)。测序引物为SP1(5’-CCGACATAGATGCAATAACTTC-3’),将测序正确的重组质粒命名为CRISPR-OaAn-1-2Target。
[0098]pYLCRISPR/Cas9Pubi-H的部分载体骨架示意图如
图1中A所示,其中,Pubi启动子、核定位信号序列(NLS)、Cas9编码基因(Cas9)、核定位信号序列(NLS)以及Tnos终止子依次连接。CRISPR-OaAn-1-2Target中的双靶点序列结构示意图如
图1中B所示,其中,OsU3启动子、Target 1序列(表达靶向Target site 1的gRNA)、OsU6a启动子、Target 2序列(表达靶向Target site 2的gRNA)依次连接。在质粒CRISPR-OaAn-1-2Target中,在Tnos终止子后连接前述双靶点序列。
[0099]2、阳性编辑苗的表型鉴定
[0100]将上述制备的阳性编辑苗T0-1、T0-2和四倍体野生稻(O.alta,野生型)种植在自然条件下,观察田间表型并测量芒长。
[0101]实验结果如
图7和
图8所示,当OaAn-1-CC和OaAn-1-DD基因发生移码突变,An-1蛋白功能丧失,在T0代芒长明显缩短。野生型芒长为4.11cm(20个芒的平均值),而T0-1芒长为1.61cm(20个芒的平均值),T0-2芒长为2.63cm(20个芒的平均值),阳性编辑苗芒长变短,便于收获。本发明证明,在四倍体野生稻中,可以通过编辑芒长主效基因OaAn-1,实现芒长的快速驯化,芒长缩短,便于收获与加工。
[0102]以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 中国科学院遗传与发育生物学研究所
<120> OaAn-1蛋白、编码基因及其相关生物材料的应用
<130> 210484
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 424
<212> PRT
<213> 野生稻(Oryza alta)
<400> 1
Met Ala Asp Glu His Phe Phe Pro Ala Gly Asp Tyr Phe Ser Ser Gly
1 5 10 15
Ala Ala Thr Gly Thr Gly Ala Leu Leu Pro Ala Ala Ser Tyr Gly Met
20 25 30
Met Pro Pro Trp Ala Val Ala Asp Asp Gln Met Met Met Met Val Pro
35 40 45
Ala Ala Ala Glu Ser Val Ala His Phe Asp Ser Ala Leu Ser Ser Leu
50 55 60
Val Ser Ser Pro Gly Gly Gly Gly Gly Leu Val Asn Gly Asn Gly Gly
65 70 75 80
Gly Gly Gly Asp Glu Met Ala Ala Ile Gly Asp Leu Ile Gly Arg Leu
85 90 95
Gly Ser Ile Cys Asn Asn Gly Ala Ser Ala Asn Asn Ser Cys Tyr Ser
100 105 110
Thr Pro Leu Ser Ser Pro Pro Arg Gly Gly Pro Pro Pro Val Thr Ala
115 120 125
Phe Arg Gly Tyr Ala Ala Val Asp Thr Gly Arg Leu Ser Arg Val Ser
130 135 140
Ser Ser Lys Ser Leu Gly Ala Gly Ala Ala Ala Thr Ala Ala Ala Leu
145 150 155 160
Asp Ser Ser Glu Ala Glu Met Ser Pro Thr Thr Ala Ala Gly Asp Gln
165 170 175
Pro Ala Lys Pro Ser Ala Ser Ala Ala Ala Ala Ala Arg Lys Arg Lys
180 185 190
Ser Ser Ala Lys Pro Lys Ala Ser Ser Ser Ser Leu Pro Thr Ala Thr
195 200 205
Ala Ala Thr Thr Asn Ala Ser Pro Lys Arg Ser Lys Val Val Ala Ala
210 215 220
Ala Ala Gly Gly Gly His Asp Gly Asp Gly Asp Ala Ala Thr Gln Glu
225 230 235 240
Glu Lys Pro Glu Pro Thr Lys Asp Tyr Ile His Val Arg Ala Arg Arg
245 250 255
Gly Gln Ala Thr Asp Ser His Ser Leu Ala Glu Arg Val Arg Arg Glu
260 265 270
Arg Ile Ser Glu Arg Met Lys Leu Leu Gln Ser Leu Val Pro Gly Cys
275 280 285
Asn Lys Ile Thr Gly Lys Ala Leu Met Leu Asp Glu Ile Ile Asn Tyr
290 295 300
Val Gln Ser Leu Gln Arg Gln Val Glu Phe Leu Ser Met Lys Leu Ala
305 310 315 320
Thr Met Asn Pro Gln Leu Asp Phe Asp Gly His Tyr Met Pro Ser Lys
325 330 335
Asp Met Asn His Met Pro Val Pro Thr Tyr Pro Ser Gly Asp Pro Thr
340 345 350
Thr Ala Thr Val Phe Ser Tyr Thr Gly Ser Pro Ala Thr Ala Asp Pro
355 360 365
Phe Asn Pro Tyr Asn Cys Trp Glu Leu Asp Leu His Thr Ala Met Gln
370 375 380
Met Arg Ala Ala Ala Ala Thr Gly Leu Ser Gln Asp Gly Leu Val Ala
385 390 395 400
Ala Met Ala Ser Ser Pro Leu Pro His Gln Pro Pro His Gly Phe Tyr
405 410 415
Gly Asp Asp Met Lys Ala Glu Pro
420
<210> 2
<211> 444
<212> PRT
<213> 野生稻(Oryza alta)
<400> 2
Met Ala Asp Glu His Phe Phe Pro Ala Gly Asp Tyr Phe Ser Ser Ser
1 5 10 15
Ser Gly Ala Thr Gly Thr Gly Ala Leu Leu Pro Gly Gly Leu Asp Val
20 25 30
Ala Ala Ala Ala Ala Tyr Gly Met Met Pro Pro Trp Ala Val Ala Asp
35 40 45
Gln Met Met Met Met Met Val Pro Ala Ala Gly Ala Glu Ala Glu Cys
50 55 60
Val Ala His Phe Asp Ser Ala Leu Ser Ser Leu Val Ser Ser Pro Gly
65 70 75 80
Gly Gly Gly Gly Leu Val Asn Gly Asn Gly Gly Gly Cys Gly Gly Gly
85 90 95
Asp Glu Met Ala Ala Ile Gly Asp Leu Ile Gly Arg Leu Gly Ser Ile
100 105 110
Cys Asn Gly Ala Ser Ala Asn Asn Ser Cys Tyr Ser Thr Pro Leu Ser
115 120 125
Ser Pro Pro Arg Gly Gly Pro Pro Pro Pro Pro Pro Leu Thr Ala Phe
130 135 140
Arg Gly Tyr Ala Ala Val Asp Thr Gly Arg Leu Ser Arg Val Ser Ser
145 150 155 160
Ser Lys Ser Leu Gly Ala Ala Ala Leu Glu Ser Ser Glu Ala Glu Met
165 170 175
Ser Pro Thr Thr Ala Ala Gly Asp Gln Pro Ala Lys Pro Ser Ala Ala
180 185 190
Ala Ala Ala Ala Ala Arg Lys Arg Lys Ser Ser Ala Lys Ala Lys Ala
195 200 205
Thr Ser Ser Ser Leu Pro Thr Ala Thr Ala Ala Thr Asn Ala Ser Pro
210 215 220
Lys Arg Ser Lys Val Ala Gly Gly Gly Gly Gly Asp Gly Asp Gly Asp
225 230 235 240
Ala Ala Ala Glu Glu Glu Lys Pro Glu Pro Ala Lys Asp Tyr Ile His
245 250 255
Val Arg Ala Arg Arg Gly Gln Ala Thr Asp Ser His Ser Leu Ala Glu
260 265 270
Arg Val Arg Arg Glu Arg Ile Ser Glu Arg Met Lys Leu Leu Gln Ser
275 280 285
Leu Val Pro Gly Cys Asn Lys Ile Thr Gly Lys Ala Leu Met Leu Asp
290 295 300
Glu Ile Ile Asn Tyr Val Gln Ser Leu Gln Arg Gln Val Glu Phe Leu
305 310 315 320
Ser Met Lys Leu Ala Thr Met Asn Pro Gln Leu Asp Phe Asp Gly His
325 330 335
Tyr Ile Thr Ser Lys Asp Thr Ser His Met Pro Met Leu Ala Tyr Pro
340 345 350
Ser Gly Asp Leu Thr Thr Ala Thr Ala Phe Ser Tyr Thr Gly Ser Pro
355 360 365
Ala Ala Thr Ala Ala Asp Pro Phe Ala Ala Tyr Asn Cys Trp Glu Leu
370 375 380
Val Asp Leu His Thr Lys Met Gln Ile Gly Ala Thr Thr Thr Gly Leu
385 390 395 400
Asn Gln Asp Gly Pro Ser Val Ala Ala Met Ala Pro Ser Pro Ser Pro
405 410 415
Pro Leu Pro His His Pro Pro His Gly Phe Tyr Gly Gly Gln Lys Gln
420 425 430
Gln Gly Thr Thr Val Asn His Met Lys Ala Glu Pro
435 440
<210> 3
<211> 1275
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atggccgacg agcacttctt ccccgccgga gattacttct cctccggcgc cgccacgggg 60
acgggcgcgt tgctgcccgc cgcgtcgtac gggatgatgc cgccgtgggc ggtggccgat 120
gaccagatga tgatgatggt gccagcggcg gcggagtccg tcgcgcactt cgactccgcg 180
ctcagctcgc tcgtgtcgtc gccgggtgga ggtggcgggc ttgtgaatgg caatggtgga 240
gggggtggtg atgagatggc ggccatcggc gacctgatcg ggcggctggg gagcatctgc 300
aacaacgggg ccagcgccaa caactcctgc tacagcacgc cactcagctc cccgccgcgc 360
ggcggcccgc ctccggtgac ggcgttccgt ggctacgccg ccgtggacac cggcaggctg 420
tccagggtct ccagcagcaa gtccctcggc gccggcgccg ccgccaccgc cgccgcattg 480
gacagctccg aggcggagat gagccccacc accgccgccg gtgaccaacc agccaagccc 540
tccgcctccg ccgccgccgc cgcccgcaag cgcaagtcct cggcgaagcc caaggcctcc 600
tcctcatcct tacccacggc tacggcagcg acgacgaacg cgagcccgaa gcggtccaag 660
gtcgtcgccg ccgccgccgg cggcggacac gacggcgacg gcgacgcggc gacgcaggag 720
gagaaacccg agccgaccaa agactacatc catgtgaggg cgaggagggg acaagccacc 780
gatagccata gcctcgccga gagggtgagg agggagagga taagcgagag gatgaagctg 840
ctgcagtcgc tcgtgccagg ctgcaacaag atcaccggca aggctctcat gctggacgag 900
atcatcaact atgtccagtc gctgcagcgt caggtcgagt ttttgtccat gaagttagcg 960
accatgaatc ctcagctgga ctttgacggc cattacatgc cttccaaaga tatgaaccac 1020
atgccagtac ccacataccc gtcaggcgac ccaaccaccg ccaccgtgtt ctcctacacc 1080
ggctctcctg ctactgccga tccattcaac ccctataact gttgggagct cgaccttcat 1140
accgcaatgc aaatgagagc cgccgccgcc accgggctca gccaagatgg cctagtggca 1200
gcgatggcat cctcgccatt gccacaccaa cctcctcacg gcttctatgg ggacgacatg 1260
aaggccgagc cgtaa 1275
<210> 4
<211> 1335
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atggccgacg agcacttctt ccccgccgga gattacttct cctcctcctc cggcgccacg 60
gggacgggcg cgttactgcc cggcgggctg gacgtcgccg ccgcggcggc atacgggatg 120
atgccgccct gggcagtggc cgaccagatg atgatgatga tggtgccggc ggcgggggcg 180
gaggcggagt gcgttgcgca cttcgactcc gcgctcagct cgctcgtgtc gtctccgggt 240
ggaggtggcg ggcttgtgaa cggcaatggc ggcggctgcg gcgggggtga tgagatggcg 300
gccatcggcg acctgatcgg ccggctcggg agcatctgca acggcgccag cgccaacaac 360
tcctgctaca gcacgccgct cagctccccg ccgcgcggcg gcccgccgcc acctccgccg 420
ctgacggcgt tccgtggcta cgccgccgtg gacaccggca ggctgtcccg ggtctccagc 480
agcaagtccc tcggcgccgc cgcattggag agctccgagg cggagatgag ccccaccacg 540
gccgccggcg accaaccagc caagccctcc gccgccgcag ccgccgccgc ccgcaagcgc 600
aagtcctcag cgaaggccaa ggccacctcc tcctccttac ccacggctac ggcagcgacg 660
aatgcgagtc cgaagcggtc caaggtcgcc ggcggcggcg gtggcgacgg cgacggcgac 720
gcggcggcgg aggaggagaa gcccgagccg gccaaagact acatccatgt gagggcgagg 780
aggggacaag ccaccgatag ccacagcctc gccgagaggg tgaggaggga aaggataagc 840
gagaggatga agcttctgca gtcgctcgtg ccaggctgca acaagatcac cggcaaggct 900
ctaatgctgg acgagatcat caactatgtc cagtcgctgc agcgtcaggt cgagtttttg 960
tccatgaagt tggcgaccat gaatcctcag ctggactttg acggccatta tataacttcc 1020
aaagatacga gtcatatgcc aatgctcgca tacccgtcag gcgacctgac caccgccacc 1080
gcgttctcct ataccggctc acccgccgcc accgccgccg atccattcgc cgcctacaac 1140
tgctgggagc tcgtcgacct ccacaccaag atgcaaatag gagccaccac cactggcctc 1200
aaccaagatg gcccatcggt cgcagcgatg gcaccctcgc cttcaccacc attgccgcac 1260
catcctcctc acggcttcta cggggggcag aagcagcagg ggacgacagt aaaccacatg 1320
aaggccgagc cgtaa 1335
<210> 5
<211> 5064
<212> DNA
<213> 野生稻(Oryza alta)
<400> 5
gatagtggca gtatatcttt tcttccgcgt tattaccgtg ctcgtgccgg catctcatct 60
cttcccaccc accaacacgg ttacttccct ccccttccca accatttctt atatataacg 120
gtcaaccacc gcctccctct ttccctctcc tctctcctct tcctccactc ccacccactc 180
tcccacgcgc cacgccgcca ccgatggccg acgagcactt cttccccgcc ggagattact 240
tctcctccgg cgccgccacg gggacgggcg cgttgctgcc cgccgcgtcg tacgggatga 300
tgccgccgtg ggcggtggcc gatgaccaga tgatgatgat ggtgccagcg gcggcggagt 360
ccgtcgcgca cttcgactcc gcgctcagct cgctcgtgtc gtcgccgggt ggaggtggcg 420
ggcttgtgaa tggcaatggt ggagggggtg gtgatgagat ggcggccatc ggcgacctga 480
tcgggcggct ggggagcatc tgcaacaacg gggccagcgc caacaactcc tgctacagca 540
cgccactcag ctccccgccg cgcggcggcc cgcctccggt gacggcgttc cgtggctacg 600
ccgccgtgga caccggcagg ctgtccaggg tctccagcag caagtccctc ggcgccggcg 660
ccgccgccac cgccgccgca ttggacagct ccgaggcgga gatgagcccc accaccgccg 720
ccggtgacca accagccaag ccctccgcct ccgccgccgc cgccgcccgc aagcgcaagt 780
cctcggcgaa gcccaaggcc tcctcctcat ccttacccac ggtaccatac tccgaccacc 840
gctccatcac ttctccgatc cccagctgac caacccataa taatgcaggc tacggcagcg 900
acgacgaacg cgagcccgaa gcggtccaag gtcgtcgccg ccgccgccgg cggcggacac 960
gacggcgacg gcgacgcggc gacgcaggag gagaaacccg agccgaccaa agactacatc 1020
catgtgaggg cgaggagggg acaagccacc gatagccata gcctcgccga gagggtaatt 1080
acctaatcaa ctaattaacc atcctctcct aattaaatcc taattagctt tttgcaagta 1140
cactaatccc caaattaatc acaatgcgcg gcacccccta attgcgcacc gttttactcc 1200
tacttgtcac taattgctct acttaattag taagttgcaa ggacgcttaa ttattaaaat 1260
ttaattagct tgtgttttgt ttaatggtag gtgaggaggg agaggataag cgagaggatg 1320
aagctgctgc agtcgctcgt gccaggctgc aacaaggtat gaacacagca ctctccagct 1380
gcaatctcat gcttaaattt tatccaaatt tatctatcca ttactccaat tttaaaattc 1440
tagccatctc tccatccatg ttactagcta gtttagagtt taatatcaaa atgtgcgaaa 1500
attttgtctc gaaaaatagt accaatttgt aatatcagaa atccgattta ttttacaatt 1560
acatagcggt actagaaatt agtggtcaaa aatgtattta agagaacgca cattaagggg 1620
gaatagtaac ctaacgtaca aaacggtctt acctgtgtgg acggagagaa cagtaattaa 1680
gtttaatata tatatataat tactttagtt tcagtattgc ctagagctag gagttggact 1740
ttttgctagt aggatagata aaattaagtg caattaatca attattttgt accgaaagta 1800
tgagcactaa ctgcggtggt tagtctacgc agccagtagt aattttgacc gtaatgcatt 1860
gtaagctacc agtagtactc ccaagttaag ctcccagtgg tccaagaaga tataataata 1920
attgattaat taataatctg agaggctctt gctctgtact taaactaatc aaaccggcta 1980
atcaattgca aggtcctggt ggtttaggtg gtgcgcacga ttattttagt tgccccaatt 2040
attgccacgg tagtgatgcc cctgccggtg gtcaaatttg ggttgaattt taaagttggt 2100
tgataacttt tatacctttt taaaaattat tgatcagttt ttttgctgga tgatcgttta 2160
ttgtctttta gcaaataaat atgaatgttg cggtgtgcag atcaccggca aggctctcat 2220
gctggacgag atcatcaact atgtccagtc gctgcagcgt caggtcgagg taccaatgca 2280
acatttgctt tagtagtgtg ctaaatgaac ttgttttaat gacaataaat ttgttggaga 2340
aaaatgttgt tgtgttctcc ttctgtccta gttagctctt aattgaagtt ctgtatgaaa 2400
ttaaacccaa taatagctaa attttggcat tggtgtgtct cacagttttt gtccatgaag 2460
ttagcgacca tgaatcctca gctggacttt gacggccatt acatgccttc caaagatgta 2520
agtagcatct ttcaatttgt tactaaaaga aaacaatgct atgtgatctg gatatcaaac 2580
ggttaagata gagtattatt cgatattgtc cctccatttg caaatgttat aacgaccgca 2640
ctcaccatat cattttcaga tgaaccacat gccagtaccc acatacccgt caggcgaccc 2700
aaccaccgcc accgtgttct cctacaccgg ctctcctgct actgccgatc cattcaaccc 2760
ctataactgt tgggagctcg accttcatac cgcaatgcaa atgagagccg ccgccgccac 2820
cgggctcagc caagatggcc tagtggcagc gatggcatcc tcgccattgc cacaccaacc 2880
tcctcacggc ttctatggca agtgaaacca aaccatcacc tctcctcgta accctaacaa 2940
atcatacata gacttttaaa atactcaaaa aaaaatcaaa acataagttt tttttttact 3000
agactacaat actggtcata ctactccagt agtactggta cggtaggttt gtttgtccaa 3060
gtttgttgag tttcgctgtt ggtggtaatt gggtgcaggg gacgacatga aggccgagcc 3120
gtaataaatg ggcgacctcc ttggccttcc cttctgtaca tacgccagcc gccgtacgtg 3180
tactccgctt ttctgctccc atcctgcagc atcagcatca gcagcagcag cagacccagc 3240
tcacaatcat tgccatcaaa gagaaagaag aggatttgtg tgtaatgctt catggcttga 3300
tgatggcttt ggctccctag cttcccttgc tcttcttctc actggatatg tgggccctct 3360
catatgtggc agcatcttct tttcaccttt ctcccctctg ccctctgcca ctgcaggtgg 3420
ggcccacctg catagggaag gagaaggttt ttcagatgca ttggtggcat gatgaagggg 3480
cacattgtca ttgtttatgc aagaacttgt ttgtgttgtg atgttgtagg acaagaggag 3540
tatgtgtgtg tttggaaatg gcaaggcagg ggagttgtgt gaccttttgt gtgtgctggt 3600
tgcatgccct aactgtagaa aaaaatggac gactgtggta gtgatgtagt ggtagtggct 3660
ttgtaggatt ggcatgcatg gggatgtatg tacttctgta tgtagagatt ggagagggtt 3720
ttgaagaaca ccttcctttt tggtgaacat tgtttgtatc aaaagtactg gaatcataat 3780
gcatgcaaga aatgtttttg aacaatattc gacaatgtcg ttagtatttt tgatgtggtt 3840
gtctatatta gtttagaatc ctttggtttg tcaaaagtta tccgcattac aatctggaag 3900
gatttaggat cttggggaca atgagaggat gagcgacaat attactatga ttatatatca 3960
cattcgcttc atctttcacc agtttttgca atagattcat gtgttgatcc ttgtcactag 4020
agcaattttt ttatcaatga actaaagata tatacccaat tgagccacaa agatgccatg 4080
gcctccatct gcattttgtt gtgacttctt aagaaattga tccatcatca tctgcatgtt 4140
gctatgactt ctggagaaat tgatccatca ttgatgcaga gtctgcatac gtactatgag 4200
gagtatgcaa taacttttag cttcttccaa atgatcggtc ggcaaaaaaa aacatgtgtt 4260
tcttgtgtca ctaataccat aattcatagg catgtcgacg attgtgctct tcctataacc 4320
atagctaacc cccctacaac caacacacaa ttaaagtgtt gaaccaacaa aatggtacta 4380
catcaataat gcatcaacct atgaaatgaa aagataactt cttcctttta ccagcattgg 4440
catttccaac caagatctcc ctagatgcac acaacatgat cagtgttaat catgggattc 4500
tctctaatca cctccacact ctcaaatcat tgtttcatct gttgccatat cctaatcaca 4560
gaaggcccca cagtgctttc tctctgtgga atctagccag tagggggagg gggcttgatc 4620
ccagctggca tgtgggcccc cacccacatc aacccttttg gatcttcttc ttcttcttct 4680
attctactcc tacatctctc tttcacattg cagctactag ctgacattgg agtacttgac 4740
aagtccttaa acaagtgcac ttttggggcc tttaattcag ttgtaatagt agtagtagaa 4800
gtaattaaat ttcttgttgt cttgtgtagc attttcttct tcatgtcttt gcccttcatt 4860
aataagtcaa gtgatgtgac aatggatgct ggaccctttt ttacctgcct ccctgaccgg 4920
ccttccttta tgcagacatc aagtcggtga gtaccaaagc agctcaactg taattctgtc 4980
attaagttgg tgattagtgc atgcaaattg tcattagcat cagtacagtt aggtgatgat 5040
taaattaaag tacagttgtg tgag 5064
<210> 6
<211> 5367
<212> DNA
<213> 野生稻(Oryza alta)
<400> 6
ctataaattt actttaaaat atcacatctt aggtctactt agattgaaag gagagagtat 60
ttggttccgc gttattacgg ccggcatctc ttcccagttc ccacccacca atacggttac 120
ttccctcccc tttcccaaac gatttcttat ataacggtca accaccgccc ctctcttttc 180
cctctccgct ctcctcctcc actcccaccc actctcccac gcgccacgcc gccaccgccg 240
acgacgacga tggccgacga gcacttcttc cccgccggag attacttctc ctcctcctcc 300
ggcgccacgg ggacgggcgc gttactgccc ggcgggctgg acgtcgccgc cgcggcggca 360
tacgggatga tgccgccctg ggcagtggcc gaccagatga tgatgatgat ggtgccggcg 420
gcgggggcgg aggcggagtg cgttgcgcac ttcgactccg cgctcagctc gctcgtgtcg 480
tctccgggtg gaggtggcgg gcttgtgaac ggcaatggcg gcggctgcgg cgggggtgat 540
gagatggcgg ccatcggcga cctgatcggc cggctcggga gcatctgcaa cggcgccagc 600
gccaacaact cctgctacag cacgccgctc agctccccgc cgcgcggcgg cccgccgcca 660
cctccgccgc tgacggcgtt ccgtggctac gccgccgtgg acaccggcag gctgtcccgg 720
gtctccagca gcaagtccct cggcgccgcc gcattggaga gctccgaggc ggagatgagc 780
cccaccacgg ccgccggcga ccaaccagcc aagccctccg ccgccgcagc cgccgccgcc 840
cgcaagcgca agtcctcagc gaaggccaag gccacctcct cctccttacc cacggtacca 900
caacaaacac tgctccggcc accgccgctc catcacttct ccgatcccca gctgaccaac 960
ccataatgca ggctacggca gcgacgaatg cgagtccgaa gcggtccaag gtcgccggcg 1020
gcggcggtgg cgacggcgac ggcgacgcgg cggcggagga ggagaagccc gagccggcca 1080
aagactacat ccatgtgagg gcgaggaggg gacaagccac cgatagccac agcctcgccg 1140
agagggtact actacctaat taaccatcca ttatccccta attatctttt gcaagtacac 1200
taatccccaa attaatcaca atccgcggcc cccctaattg cgcaccgtgt tactacttgt 1260
cactaattgc tctacttaat taagttgcaa ggacacttaa ttattgttta acggtaggtg 1320
aggagggaaa ggataagcga gaggatgaag cttctgcagt cgctcgtgcc aggctgcaac 1380
aaggtatgaa cacaacactc tccagctgca atctctcatg cttaaatttc cttcaaattt 1440
atctatccat tactccaatt ttaaaattct agcaatcctc ctccatccat gttactagtt 1500
tagagtctaa tatcgaaatg tgcgaaaaag aattcctgaa aagtagtacc aatttgtaat 1560
attagaaacc cgctatattt tacgattata agcggtacta taaattagtc atcaaaatag 1620
tatttcggtg aacgcgcatt aagggagaat agtaacctaa catacaaaat ggacttacct 1680
gtgtggacgg agagaacaat aattaagttt aacatatata attactttag tttcagtatt 1740
gcctagagct aggagttgga ctttttgcta ctaggataga taaaattaag tacaaataat 1800
caattttttg taccggatgt atgagcacta actgcggtgg ttagtctaca cagccagtag 1860
taattttgac cgtaatgcat ctcctaggtt aagctcccaa tggtccaaga agatataata 1920
ataattgatt aattaataat ctgataggct cttgctctgc acttaaacta atcaaaccgg 1980
ctaatcaatt gcaaggtcct ggtggttttg gtggtgcgca cgattatttt agttgcccca 2040
attattgcca cggtagtgtg ccccagccgg tggtcaaatt tgggttgaat tttaaatttg 2100
gttgataact tttctacctt tttaaaaatt attgttgagt tttttttgtt ggatgattgt 2160
tcattgtttt tgtttagtca atgtgaatgt tgcggtgtgc agatcaccgg caaggctcta 2220
atgctggacg agatcatcaa ctatgtccag tcgctgcagc gtcaggtcga ggtaccaatg 2280
caacattgct ctaatagtgt gctaaatgaa cttgttttaa tgacaataat tcgttggaga 2340
aaattgttgt tgtgtgctcc ttctgtccta gactagctct taattgaagt tttgtatgga 2400
accaaatagc taaattttaa cattttgaca ttggtgtgtc tcatagtttt tgtccatgaa 2460
gttggcgacc atgaatcctc agctggactt tgacggccat tatataactt ccaaagatgt 2520
aagtagtatc ttcaatttgt tacgtactaa aagagaaaac atttgatatc tggacacaaa 2580
caaacattgc cactatgttt ttccctcaat ttgcaaatgt tataacgacc gtaattaccc 2640
ctatcatttt cagacgagtc atatgccaat gctcgcatac ccgtcaggcg acctgaccac 2700
cgccaccgcg ttctcctata ccggctcacc cgccgccacc gccgccgatc cattcgccgc 2760
ctacaactgc tgggagctcg tcgacctcca caccaagatg caaataggag ccaccaccac 2820
tggcctcaac caagatggcc catcggtcgc agcgatggca ccctcgcctt caccaccatt 2880
gccgcaccat cctcctcacg gcttctacgg caagtgaaac caaaccacca gatcttctca 2940
tatccttaaa aaaagattaa aacatacatt ctctatttca aagtattgct acctagtaca 3000
tgattggaca ctttctagta caacgaatct aaatagagaa cctatctaga tgcgtctgta 3060
tcgctccctt catcccaaat tatagtatac ccttattttt agaaaaatca aactcggtaa 3120
cttttgacta ataatcattc taacaatatc tataagaagt attatgcgtg ctatatcact 3180
agatttatat ttcaaattag ttttatatga tactaatttt atatctattg gtaacgtaac 3240
attaaataaa ttaatggtca aaatatgtca ttgaagaccg tgtaaaaaat ttataagact 3300
tataattaaa caaagtaagt aagaaatgtt caatgttaac attttaggac agagatagta 3360
cgctgttttt tctctgtggt actggaccat agtagtggtc atggtgtagg tttgtttgtc 3420
caagtttgtt gagtttcgct gttggtggta attgggcgca ggggggcaga agcagcaggg 3480
gacgacagta aaccacatga aggccgagcc gtaataaatg cgcgacctcc ttcgccttcc 3540
ttctgtacat acgccagccg ccgtacgtac tccgcttttc tgctcccatc ctgcagcatc 3600
agcatcagca gcagcaaacc cagctcacaa tcattgccat caaagagaag aagaggatgt 3660
gtgcttggct ccctcctcct cctccctctc actggatatg tgggccctct catatgtggc 3720
agcatctttt tccccccctt tctccccctc tgccctctgt cactgcaggt ggggcccgtc 3780
tgcataggga aggagaaggt ttttcaggct caactttttc agatgcattg gcatgcaggc 3840
aacattgtca ttgtttagca aggactgtag aaaagccagg ggagctgtga ccattgtgtg 3900
tgctggttgc atgccctaac tgtagaaaag gaggactgtg gcttggtagg attggcatgc 3960
atggggatgt atgtactatt atgtatgtag agattggaga gggttttgag gaacaccttc 4020
ctttttgggg ggtgaacatt gtttgtatca gaagtaccga aatcatcgcg catgcaagaa 4080
atgtctttga tcaataaccg acgatgtcgt tagtattttt gatgtggttg tctatgttag 4140
ttcagaattc tttgtttgtc aaaagttatc tgtgttataa tctagacggg tttaggattt 4200
tgggaacaac tagaggatga gcgataatat tattatgatt atatatccta ttcgcttcat 4260
cattcaccag tttttgcaat agattcctgt gttgatcctt gtcattggag caaatttttt 4320
gtcaatgaac taaagatata tacccaattg agccacaacg atgccatggc cttcatctgc 4380
attttgttat gacttcttaa gaaattgatc catcattgat gcagagagtc tgcatatgta 4440
ctatgaggag tatacaataa tttttacctt cttccaaatg atcgatcagc taaaaaagaa 4500
catgtgtttt ctatgtcact aataccatag ttcataggca tgtaggtgat tgtgcgcttc 4560
gtagaaccat agctaatccc cctacaacca acacacagta gaagtgttga accaacaaaa 4620
aatggtacta catgaataat gcatcaacct aatgaaatga aaagataact tcttctcttt 4680
ttttttacca gcattggcat ttccaaccaa gatctcccta gatgcacaca acatgatcag 4740
tgttaatcat gggcttccct ctaatcacct cctcactctc aatcattgtt tcatccgttg 4800
ccatatccta atcacagcag ggccccacag tgctttctct ctgtggaatc tagccagtag 4860
gggggagggg acttgatccc agctggcatg tgggccccac ccacatcaac ccttttggat 4920
cttcttcttc ttctattcta ctcctgcatc tctctttcac attgcagcta ctattagctg 4980
acattggagt acttgacaag tccttgaaca agtgcacttt tggggccttt aattcagttg 5040
tggtggtagt agagataatt aaatttcttg ttgtcttgtg aggcacttac ttgttcatgt 5100
ctttgccctt cattaagtca agtgatgtga caatggatgc tggacccttt tttacctgcc 5160
tccctgaccg gccttccttt atgcagacat caagtcggtg agtaccaagc agctcaactg 5220
taattctgtc attaagttgt tgattagtgc atgcaaattg tcattagcat cagtacagtt 5280
aagagaggat tagattaaag tacagttgtg tgagatgcta actactgatt agagaggtgt 5340
taatttgggg attaaggcaa ggctggc 5367
<210> 7
<211> 20
<212 > DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ccgaagcggt ccaaggtcgc 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
acatccatgt gagggcgagg 20