{"title":"牛肠炎冠状病毒(F15)基因组序列分析","authors":"C. Crucière , J. Laporte","doi":"10.1016/S0769-2617(88)80012-1","DOIUrl":null,"url":null,"abstract":"<div><p>Sequences encoding the N protein of the bovine enteritic coronavirus-F15 strain (BECV-F15) have been cloned in PBR322 plasmid using cDNA produced by priming with oligo-dT on purified viral genomic RNA. Some 265 insert-containing clones were studied. Hybridization of these inserts with poly(A)<sup>+</sup> RNA extracted from infected cells led to the conclusion that they were located at the 3′-end of the genome.</p><p>After subcloning in M13 phage DNA, clones were sequenced by the Sanger technique. A 1,710-nucleotide sequence corresponding to the gene coding for the viral N-protein was established. It shows 2 overlapping open reading frames (ORF). The 3′-non-coding end of the gene has an 8-nucleotide sequence in common with the homologous genome areas of MHV, TGE and IBV viruses. This sequence may represent the polymerase RNA binding site.</p><p>An upstream sequence surrounding the first AUG of the smaller ORF corresponds to a potentially functional initiation codon. The sequence of the primary translation product deduced from the DNA sequence predicts a polypeptide of 207 amino acids (22.9 Kd) with a high leucine (19.8%) content, possessing a hydrophobic N-terminal end.</p><p>The larger ORF has a coding capacity of 448 amino acids (49.4 Kd), corresponding to the N-protein molecular weight. The deduced protein possesses 43 serine residues (9.6% of the total amino acid content) which may be phosporylated and involved in N-protein/RNA binding. N-protein also has 5 regions with a high basic amino acid content. One of them is also serine-rich and has a strong homology site with MHV, TGE and IBV viruses. In the first part of the N-terminal, a 12-amino-acid sequence (PRWYFYYLGTGP) is highly conserved for BECV-F15, JHM, TGE and IBV viruses. BCV Mebus strain and BECV-F15 have only minor differences in their N-protein sequence.</p></div><div><p>Nous avons cloné l'ARN génomique du coronavirus entéritique bovin F15 (BECV-F15), dans le plasmide PBR322 après avoir préparé le cDNA correspondant à l'aide d'une amorce oligo-dT: 265 clones ont été étudiés. Leur hybridation avec les ARN poly(A)<sup>+</sup> extraits des cellules infectées nous a permis de les localiser à l'extrémité 3′-terminale du génome.</p><p>Ces clones ont été séquencés par la technique de Sanger, après sous-clonage dans l'ADN du phage M13. Nous avons déterminé une séquence de 1.710 nucléotides correspondant au gène codant pour la protéine N virale. Elle présente deux cadres ouverts de lecture (ORF) chevauchants. On observe à l'extrémité 3′-terminale non codante du génome une séquence de 8 nucléotides observée également dans la région homologue des virus MHV, GET et IBV. Cette séquence pourrait être le site de fixation de l'ARN polymérase.</p><p>Le premier AUG du plus petit ORF possède en amont une séquence nucléotidique qui en fait un site d'initiation potentiellement fonctionnel. La séquence du produit primaire de traduction que l'on en déduit est un polypeptide de 207 acides aminés (22,9 Kd) à haute teneur en leucine (19,8%) ayant une extrémité N-terminale hydrophobe.</p><p>Le plus grand ORF a une capacité de codage de 448 acides aminés (49,4 Kd), correspondant à la masse moléculaire de la protéine N. La protéine déduite contient 43 résidus sérine (9,6% des acides aminés), qui peuvent être phosphorylés et impliqués dans la liaison entre la protéine N et l'ARN génomique. Cette protéine présente également 5 régions fortement basiques, et l'une d'entre elles est également riche en sérine et a une forte homologie de séquence avec la région homologue des protéines N des virus MHV, GET et IBV. En outre, la première partie de l'extrémité N-terminale montre un enchaînement de 12 acides aminés (PRWYFYYLGTGP) très conservé entre ces quatre même virus.</p><p>Les séquences des protéines N de la souche Mebus du BCV et du BECV-F15 ne présentent que des différences mineures.</p></div>","PeriodicalId":77667,"journal":{"name":"Annales de l'Institut Pasteur. Virology","volume":"139 ","pages":"Pages 123-138"},"PeriodicalIF":0.0000,"publicationDate":"1988-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://sci-hub-pdf.com/10.1016/S0769-2617(88)80012-1","citationCount":"18","resultStr":"{\"title\":\"Sequence and analysis of bovine enteritic coronavirus (F15) genome\",\"authors\":\"C. Crucière , J. Laporte\",\"doi\":\"10.1016/S0769-2617(88)80012-1\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"<div><p>Sequences encoding the N protein of the bovine enteritic coronavirus-F15 strain (BECV-F15) have been cloned in PBR322 plasmid using cDNA produced by priming with oligo-dT on purified viral genomic RNA. Some 265 insert-containing clones were studied. Hybridization of these inserts with poly(A)<sup>+</sup> RNA extracted from infected cells led to the conclusion that they were located at the 3′-end of the genome.</p><p>After subcloning in M13 phage DNA, clones were sequenced by the Sanger technique. A 1,710-nucleotide sequence corresponding to the gene coding for the viral N-protein was established. It shows 2 overlapping open reading frames (ORF). The 3′-non-coding end of the gene has an 8-nucleotide sequence in common with the homologous genome areas of MHV, TGE and IBV viruses. This sequence may represent the polymerase RNA binding site.</p><p>An upstream sequence surrounding the first AUG of the smaller ORF corresponds to a potentially functional initiation codon. The sequence of the primary translation product deduced from the DNA sequence predicts a polypeptide of 207 amino acids (22.9 Kd) with a high leucine (19.8%) content, possessing a hydrophobic N-terminal end.</p><p>The larger ORF has a coding capacity of 448 amino acids (49.4 Kd), corresponding to the N-protein molecular weight. The deduced protein possesses 43 serine residues (9.6% of the total amino acid content) which may be phosporylated and involved in N-protein/RNA binding. N-protein also has 5 regions with a high basic amino acid content. One of them is also serine-rich and has a strong homology site with MHV, TGE and IBV viruses. In the first part of the N-terminal, a 12-amino-acid sequence (PRWYFYYLGTGP) is highly conserved for BECV-F15, JHM, TGE and IBV viruses. BCV Mebus strain and BECV-F15 have only minor differences in their N-protein sequence.</p></div><div><p>Nous avons cloné l'ARN génomique du coronavirus entéritique bovin F15 (BECV-F15), dans le plasmide PBR322 après avoir préparé le cDNA correspondant à l'aide d'une amorce oligo-dT: 265 clones ont été étudiés. Leur hybridation avec les ARN poly(A)<sup>+</sup> extraits des cellules infectées nous a permis de les localiser à l'extrémité 3′-terminale du génome.</p><p>Ces clones ont été séquencés par la technique de Sanger, après sous-clonage dans l'ADN du phage M13. Nous avons déterminé une séquence de 1.710 nucléotides correspondant au gène codant pour la protéine N virale. Elle présente deux cadres ouverts de lecture (ORF) chevauchants. On observe à l'extrémité 3′-terminale non codante du génome une séquence de 8 nucléotides observée également dans la région homologue des virus MHV, GET et IBV. Cette séquence pourrait être le site de fixation de l'ARN polymérase.</p><p>Le premier AUG du plus petit ORF possède en amont une séquence nucléotidique qui en fait un site d'initiation potentiellement fonctionnel. La séquence du produit primaire de traduction que l'on en déduit est un polypeptide de 207 acides aminés (22,9 Kd) à haute teneur en leucine (19,8%) ayant une extrémité N-terminale hydrophobe.</p><p>Le plus grand ORF a une capacité de codage de 448 acides aminés (49,4 Kd), correspondant à la masse moléculaire de la protéine N. La protéine déduite contient 43 résidus sérine (9,6% des acides aminés), qui peuvent être phosphorylés et impliqués dans la liaison entre la protéine N et l'ARN génomique. Cette protéine présente également 5 régions fortement basiques, et l'une d'entre elles est également riche en sérine et a une forte homologie de séquence avec la région homologue des protéines N des virus MHV, GET et IBV. En outre, la première partie de l'extrémité N-terminale montre un enchaînement de 12 acides aminés (PRWYFYYLGTGP) très conservé entre ces quatre même virus.</p><p>Les séquences des protéines N de la souche Mebus du BCV et du BECV-F15 ne présentent que des différences mineures.</p></div>\",\"PeriodicalId\":77667,\"journal\":{\"name\":\"Annales de l'Institut Pasteur. Virology\",\"volume\":\"139 \",\"pages\":\"Pages 123-138\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"1988-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"https://sci-hub-pdf.com/10.1016/S0769-2617(88)80012-1\",\"citationCount\":\"18\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Annales de l'Institut Pasteur. Virology\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://www.sciencedirect.com/science/article/pii/S0769261788800121\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Annales de l'Institut Pasteur. Virology","FirstCategoryId":"1085","ListUrlMain":"https://www.sciencedirect.com/science/article/pii/S0769261788800121","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 18
摘要
利用纯化的病毒基因组RNA上的寡聚dt引物制备的cDNA,在PBR322质粒上克隆了牛肠炎冠状病毒- f15株(BECV-F15) N蛋白编码序列。共对265个含插入克隆进行了研究。将这些插入物与从感染细胞中提取的poly(A)+ RNA杂交后得出结论,它们位于基因组的3 '端。在M13噬菌体DNA亚克隆后,用Sanger技术对克隆进行测序。建立了与病毒n蛋白编码基因对应的1710个核苷酸序列。它显示两个重叠的开放阅读帧(ORF)。该基因的3 ' -非编码端与MHV、TGE和IBV病毒的同源基因组区域有8个核苷酸序列。这个序列可能代表了聚合酶RNA的结合位点。较小ORF的第一个AUG的上游序列对应一个潜在功能的起始密码子。根据DNA序列推断出的初级翻译产物序列预测为207个氨基酸(22.9 Kd)的多肽,亮氨酸含量高(19.8%),具有疏水的n端。较大的ORF编码容量为448个氨基酸(49.4 Kd),与n蛋白分子量相对应。该蛋白含有43个丝氨酸残基(占总氨基酸含量的9.6%),可能被磷酸化并参与n蛋白/RNA的结合。n蛋白也有5个碱基氨基酸含量较高的区域。其中一种也富含丝氨酸,与MHV、TGE和IBV病毒有很强的同源位点。在n末端的第一部分,一个12个氨基酸的序列(PRWYFYYLGTGP)对BECV-F15、JHM、TGE和IBV病毒高度保守。BCV Mebus株与BECV-F15株的n蛋白序列差异较小。Nous avons clon l'ARN gsamonomique du冠状病毒entsamritique bovin F15 (BECV-F15), dles质粒PBR322 apr avoir pracimparsle cDNA对应的l'aide d'une amorce oligo-dT: 265克隆onsametacrique bovin F15。为了杂交用莱斯是保利(A) + extraits des小房毒气常识有的les本土化l 'extremite 3 '终端纤维du基因组。这些克隆不是基于Sanger技术,而是基于M13噬菌体的Sanger技术。Nous avons danci.911cha.com Nous avons danci.911cha.com N . cn . cn . cn . cn . cn . cn . cn . cn . cn。Elle pracimsente two干部ouvert de lecture (ORF) chevauchants。观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:1 .观察到:Cette ssamquence pourrait être lesite de fixation de l'ARN polymsamrase。总理奥古斯特加小的ORF的可能性,在一个单一的samsamquence核samsamquence中,samsamudique在启动电位元件的功能上是完全失败的。La ssamquence du product priire de tradingque l'on en dsamduit est un polypeptide de 207 acids aminsamuys (22,9 Kd) haute teneur en leucine (19,8%) and an extrsamumit n端疏水剂。Le plus grand ORF a une capacit de codage de 448个acides aminsamas (49,4 Kd),通讯员la mass molculaire de la proprosamine N. la proprosamine dcamite,通讯员la mass molculaire de la proprosamine N. la proprosamine dcamite (9.6% de acides aminsamas),相当一致être phospylsamas et implicqusamas dans and la liaison entre la proprosamine N et l'ARN gsamnomique。cte - procatine - procatine - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade - sade因此,la premire party de l' extrastimmit N-terminale montre unenchament de 12 - acides aminacetys (PRWYFYYLGTGP) tr conservacentres quatre même病毒。在BCV和BCV - f15中,有两个不同的ccv和ccv - f15。
Sequence and analysis of bovine enteritic coronavirus (F15) genome
Sequences encoding the N protein of the bovine enteritic coronavirus-F15 strain (BECV-F15) have been cloned in PBR322 plasmid using cDNA produced by priming with oligo-dT on purified viral genomic RNA. Some 265 insert-containing clones were studied. Hybridization of these inserts with poly(A)+ RNA extracted from infected cells led to the conclusion that they were located at the 3′-end of the genome.
After subcloning in M13 phage DNA, clones were sequenced by the Sanger technique. A 1,710-nucleotide sequence corresponding to the gene coding for the viral N-protein was established. It shows 2 overlapping open reading frames (ORF). The 3′-non-coding end of the gene has an 8-nucleotide sequence in common with the homologous genome areas of MHV, TGE and IBV viruses. This sequence may represent the polymerase RNA binding site.
An upstream sequence surrounding the first AUG of the smaller ORF corresponds to a potentially functional initiation codon. The sequence of the primary translation product deduced from the DNA sequence predicts a polypeptide of 207 amino acids (22.9 Kd) with a high leucine (19.8%) content, possessing a hydrophobic N-terminal end.
The larger ORF has a coding capacity of 448 amino acids (49.4 Kd), corresponding to the N-protein molecular weight. The deduced protein possesses 43 serine residues (9.6% of the total amino acid content) which may be phosporylated and involved in N-protein/RNA binding. N-protein also has 5 regions with a high basic amino acid content. One of them is also serine-rich and has a strong homology site with MHV, TGE and IBV viruses. In the first part of the N-terminal, a 12-amino-acid sequence (PRWYFYYLGTGP) is highly conserved for BECV-F15, JHM, TGE and IBV viruses. BCV Mebus strain and BECV-F15 have only minor differences in their N-protein sequence.
Nous avons cloné l'ARN génomique du coronavirus entéritique bovin F15 (BECV-F15), dans le plasmide PBR322 après avoir préparé le cDNA correspondant à l'aide d'une amorce oligo-dT: 265 clones ont été étudiés. Leur hybridation avec les ARN poly(A)+ extraits des cellules infectées nous a permis de les localiser à l'extrémité 3′-terminale du génome.
Ces clones ont été séquencés par la technique de Sanger, après sous-clonage dans l'ADN du phage M13. Nous avons déterminé une séquence de 1.710 nucléotides correspondant au gène codant pour la protéine N virale. Elle présente deux cadres ouverts de lecture (ORF) chevauchants. On observe à l'extrémité 3′-terminale non codante du génome une séquence de 8 nucléotides observée également dans la région homologue des virus MHV, GET et IBV. Cette séquence pourrait être le site de fixation de l'ARN polymérase.
Le premier AUG du plus petit ORF possède en amont une séquence nucléotidique qui en fait un site d'initiation potentiellement fonctionnel. La séquence du produit primaire de traduction que l'on en déduit est un polypeptide de 207 acides aminés (22,9 Kd) à haute teneur en leucine (19,8%) ayant une extrémité N-terminale hydrophobe.
Le plus grand ORF a une capacité de codage de 448 acides aminés (49,4 Kd), correspondant à la masse moléculaire de la protéine N. La protéine déduite contient 43 résidus sérine (9,6% des acides aminés), qui peuvent être phosphorylés et impliqués dans la liaison entre la protéine N et l'ARN génomique. Cette protéine présente également 5 régions fortement basiques, et l'une d'entre elles est également riche en sérine et a une forte homologie de séquence avec la région homologue des protéines N des virus MHV, GET et IBV. En outre, la première partie de l'extrémité N-terminale montre un enchaînement de 12 acides aminés (PRWYFYYLGTGP) très conservé entre ces quatre même virus.
Les séquences des protéines N de la souche Mebus du BCV et du BECV-F15 ne présentent que des différences mineures.