Relatia SARS-CoV cu alti virusuri ARN patogene explorate prin profilarea utilizarii tetranucleotidelor

  • Articol de cercetare
  • Acces deschis
  • Publicat: 20 septembrie 2003

BMC Bioinformatics volumul 4 , Numar articol: 43 (2003) Citati acest articol

  • 14k accesari

  • 18 citate

  • Detalii despre valori

Abstract

fundal

Originea exacta a cauzei sindromului respirator acut sever (SARS) este inca o intrebare deschisa. Relatia secventei genomice a SARS-CoV cu 30 de virusi ARN monocatenari diferiti ( ARN ss ) din diferite familii a fost studiata folosind doua abordari non-standard. Ambele abordari au inceput cu profilarea vectoriala a modelului V de utilizare a tetra-nucleotidelor pentru fiecare virus. In abordarea unuia, o masura de distanta a unui vector V , bazata pe coeficientul de corelatie, a fost conceputa pentru a construi un arbore de relatie prin algoritmul de imbinare vecina. In abordarea a doua, a fost efectuata o analiza a factorilor multivariati pentru a obtine tiparele incorporate de utilizare a tetra-nucleotidelor. Aceste tipare au fost ulterior folosite pentru clasificarea virusilor selectati.

Rezultate

Ambele abordari au dat rezultate de relatie care sunt in concordanta cu clasificarea cunoscuta a virusului. Ei au indicat, de asemenea, ca genomul virusurilor ARN din aceeasi familie se conformeaza unui model specific de utilizare a cuvintelor. Pe baza corelatiei tiparelor generale de utilizare a tetra-nucleotidelor, virusul gastroenteritei transmisibile (TGV) si virusul coronar felin (FCoV) sunt cele mai apropiate de SARS-CoV. In mod surprinzator, virusurile ARN care nu trec printr-o etapa ADN au prezentat o discriminare remarcabila impotriva di-nucleotidei CpG si UpA ( z = -77,31, respectiv -52,48) si selectiei pentru UpG si CpA ( z = 65,79,49,99, respectiv) . Se discuta factorii potentiali care influenteaza aceste prejudecati.

Concluzie

Studiul utilizarii cuvintelor genomice este o metoda puternica de clasificare a virusilor ARN. Congruenta rezultatelor relatiei cu clasificarea cunoscuta indica faptul ca exista semnale filogenetice in tiparele de utilizare a tetra-nucleotidelor, care este cel mai proeminent in cadrul de citire deschis al replicazei.

fundal

Sindromul respirator acut sever (SARS), o boala infectioasa recent identificata, a pus in pericol sanatatea populatiei umane in peste 30 de natiuni. A provocat peste 812 vieti si a infectat peste 8442 (9,61% rata mortalitatii) pana la 2 iulie 2003 [1] de la izbucnirea sa in noiembrie 2002 in provincia GuangDong, Republica Populara Chineza. Pana la 15 mai 2003, s-a constatat ca agentul etiologic primar pentru SARS indeplinea postulatul lui Koch prin infectia experimentala a macacilor cynomolgus ( Macaca fascicularis ) [2]. escorte.1 Cronicile pentru descoperirea SARS CoronaVirus (SARS-CoV) pot fi gasite in articole [de exemplu [3, 4]] si site-uri web [de exemplu [5]].

O intrebare obisnuita este adesea pusa atunci cand investigam evolutia virala: ce semn distinctiv, in termenii secventei genomului sau al utilizarii cuvintelor ARN, ar putea fi folosit pentru a urmari aparitia unui nou agent patogen la oameni / animale? In special, virusurile Corona sunt predispuse la recombinare [6, 7] si, ca toti ceilalti virusi, mutati la o frecventa ridicata [8]. Acest lucru face extrem de periculos sa incerci sa urmaresti originea virusului. Cu toate acestea, acest lucru ne-a determinat sa investigam relatiile lor folosind utilizarea cuvantului ARN, sperand sa identificam unii virusi ARN care afiseaza un model de utilizare a cuvantului similar. Astfel de virusi ARN ar putea sugera despre originea SARS-CoV. Acest studiu va contribui la intelegerea noastra despre utilizarea cuvantului ARN al SARS-CoV si al altor virusi ARN patogeni. In studiul de fata, am explorat relatiile a 31 de virusi ARN,

Analiza preliminara a datelor secventei a indicat faptul ca exista 11-14 cadre deschise de citire in genomul SARS-CoV [9-11]. Ordinea generala a genelor pentru acest agent patogen nou a sprijinit plasarea sa in familia Coronaviridae, care include virusurile CoronaV animale / umane. Trebuie subliniat faptul ca similitudinea secventei prezentate este atribuita in principal ARN polimerazei dependente de ARN (enzima de replicare sau RdRp) care se afla in primele doua cadre deschise de citire (ORF). Aceste doua ORF constituie mai mult de 65% (> 20 kb ) din dimensiunea totala a genomului si aceste regiuni sunt mai conservate in secventele lor de nucleotide datorita rolului lor specializat pentru replicarea ARN-ului viral. Prin urmare, a fost investigata si posibila relatie bazata doar pe secventa enzimei de replicare.

Rezultate si discutii

Poluarea mono-nucleotidica

Tabelul 1 prezinta defalcarea secventei ARN in frecvente mononucleotidice pentru 31 de genomi virali din setul nostru de date. Cu exceptia virusului bolii hemoragice a iepurelui (RHV) care arata o utilizare echitabila a celor patru nucleotide in numar aproximativ egal, ceilalti virusi ARN au o compozitie genomica partinitoare. CoronaVirus bovin (BCoV) si CoronaVirus 229E uman (HCoV) favorizeaza nucleotida U (35,5% si 34,6%) in detrimentul nucleotidei C (15,3% si 16,7%). Biasurile nucleotidice relativ puternice sunt vizibile in celelalte genomi si vom mentiona cateva dintre extreme. Cel mai mare numar de baza este de 28,4% G in virusul febrei galbene (YFV), 38,9% A in virusul respirator sincitial (RSV), 35,5% U in virusul CoronaVovinic Bovin (BCoV) si 28,5% numar C in Foot-and- Virusul bolii gurii (FMV). dame de companie cluj non stop Cel mai mic numar de baze este 15. 8% G in virusul respirator sincitial uman (HRV), 21,2% A in virusul arteritei ecvine (EV1), 20,9% U in virusul Igbo Ora (IOV) si 13,6% C in virusul febrei efemere bovine (BFV). Nucleotida A este cea mai populara baza printre virusurile ARN (variind de la 21,2% la 38,9%), iar C este nucleotida cea mai variabila (variind de la 13,6% la 33,1%).

Tabelul 1 Virusul ARN in studiul curent.

Din punctul de vedere al analizei compozitiei genomice generale, continutul de G + C este o proprietate interesanta pentru un genom, in sensul ca continutul general se coreleaza adesea cu patogenitatea organismului [12]. Majoritatea genomilor agentilor patogeni au un continut scazut de G + C, in timp ce unii, cum ar fi Mycobacterium tuberculosis, au un continut relativ ridicat de G + C. Prin urmare, asa cum era de asteptat in Tabelul 1, am remarcat faptul ca majoritatea virusurilor patogene sunt bogate in A + U (> 50%), cu exceptia virusului porcin de reproducere si sindrom respirator (PRV), virusul arteritei ecvine (EV1), boala hemoragica a iepurelui (RHV), virusul febrei hemoragice simiene (SFV) si virusul febrei aftoase C (FMV).

Tendinta di-nucleotidica

Frecventele de aparitie pentru di-nucleotide au fost comparate cu omologii aleatori ai ARN avand aceeasi proportie de baza pentru a calcula valoarea z care reflecta polarizarea lor di-nucleotidica (Tabelul 2). Dintre cele 31 de secvente de virus examinate, frecventele de aparitie pentru di-nucleotide nu au fost distribuite aleatoriu, doar cateva di-nucleotide exceptionale incepand cu un reziduu de purina prezent la frecventele asteptate (ApC, ApG, GpC, | z | <3 ). O abatere remarcabila de la frecventele asteptate are loc pentru perechile di-nucleotidice CpG si UpA (suprimare sau subreprezentare, z <-50), precum si perechile di-nucleotide CpA si UpG (imbunatatire sau supra-reprezentare, z> 40). Aceste tendinte di-nucleotidice, impreuna cu tendintele mono-nucleotidice [13], au un impact direct asupra utilizarii codonilor de virusi. De exemplu, in utilizarea codonilor pentru cele 24 de secvente de codificare a proteinelor in CoronaVirus 229E uman (Tabelul 3), doar 2,85% dintre codoni contin sub-cuvantul sub-reprezentat CpG di-nucleotid in timp ce 11,26% din codoni contin CpA di supra-reprezentat -nucleotida (utilizarea codonului agregat care contine fiecare sub-cuvant di-nucleotidic fara partinire mono- si di-nucleotida este aproape de 6,25%).

Tabelul 2 Tendinta di-nucleotidica pentru sase virusi ARN.
Tabelul 3 Utilizarea codonilor pentru Human CoronaVirus 229E (HCoV).

In genomii de ADN dublu catenar, deficienta in di-nucleotida CpG se presupune adesea ca se datoreaza faptului ca sunt tintele activitatii metiltransferazei care duce la dezaminarea citozinei [14, 15]. Cu toate acestea, este putin probabil ca mecanismul de dezaminare care modifica continutul genetic la nivelul ADN sa afecteze continutul de ARN viral al majoritatii virusilor de ARN fara o etapa ADN. curve din tulcea S-ar putea sa existe citozina ARN metilaze specifice care ar putea fi responsabile de acest efect [16]. Cu toate acestea, este mai consecvent sa propunem ca, spre deosebire de mecanismul de dezaminare a citozinei in domeniul ADN-ului, procesul dominant este dezaminarea citozinei in virusurile ARN, transformand citozina in uracil (C ♦ U) in loc de timina (T). Ca o consecinta a acestui mecanism,z > 19). In mod interesant, exista dovezi experimentale in vitro ca rata de dezaminare a citozinei este mai rapida (> 100 de ori) in monocatenar decat in ​​starea dublu-catenara [17]. In afara de subreprezentarea in di-nucleotida CpG si supra-reprezentare in di-nucleotida CpA si UpG, motivul deficitului observat de di-nucleotida UpA in ARN poate fi explicat prin labilitatea sa chimica [18]. Dinucleotida UpA este chimic cea mai instabila dintre cele 16 dinucleotide. Mai mult, UpA pare a fi o tinta preferentiala pentru ribonucleaze [19]. Aceasta labilitate ar crea o presiune de selectie impotriva di-nucleotidei UpA in virusurile ARN.

Daca alegem o valoare critica pentru z (| z | = 3,29) care permite doar o sansa de eroare 1 din 1000 pentru clasificarea unui cuvant ca partinitor (supra / subreprezentat), toate di-nucleotidele prezinta un fel de partinire in model de utilizare a 31 de virusi diferiti (Tabelul 4, derivat din forma completa a Tabelului 2 furnizat ca fisier suplimentar 1). Cauzele acestor prejudecati asteapta investigatii suplimentare.

Tabelul 4 Statistici generale pentru di-nucleotide si tetra-nucleotide partinitoare.

Bias tetra-nucleotidic

Inspectia modelului de utilizare a tetra-nucleotidelor pentru virusurile ARN (fisierul suplimentar 2) releva diferente considerabile. Frecventele de aparitie pentru tetra-nucleotide au fost comparate cu cromozomii artificiali construiti ca secvente de ARN aleatorii avand aceeasi succesiune de nucleotide pana la ordinul trei pentru a calcula valorile z care reflecta tendinta lor de tetra-nucleotide in virusul corespunzator (Tabelul 5). Daca alegem o valoare critica pentru z (| z| = 3.29) care permite doar o sansa de eroare 1 din 1000 pentru clasificarea unui cuvant ca supra / subreprezentat, 96% dintre tetra-nucleotidele prezinta o puternica partinire in tiparul lor de utilizare in 31 de virusi (prezentat in Tabelul 4, derivat din formularul complet al Tabelului 5 furnizat ca fisier suplimentar 1). Acest lucru a indicat cu tarie ca tetra-nucleotidele sunt utilizate intr-o maniera diferita intre diferiti virusi, oferindu-ne un instrument pentru a studia relatiile dintre virusi pe baza tendintei tetra-nucleotidice prezentate in genomul lor. escorte costinesti

Tabelul 5 Poluarea tetra-nucleotidica pentru trei virusuri ARN. Particularitatea tetra-nucleotidica in trei virusi. Valoarea z cuantifica tendinta tetra-nucleotidica, asa cum este definita in ecuatia (1). N ( w ) si E ( w ) sunt frecventa reala si preconizata de aparitie pentru cuvantul w .

Abordarea 1 – Relatia secventiala a virusilor pe baza corelatiei tendintei tetra-nucleotidice

Au fost derivati doi arbori de relatie, unul din intregul genom si celalalt din enzima de replicare (Figura 1). Rezultatul bazat pe secventa enzimatica de replicare a fost inclus deoarece aceste regiuni din virusurile ARN sunt supuse unei presiuni selective puternice pentru a asigura replicarea cu succes a propriului ARN in celula gazda. Cei doi arbori la distanta pot fi grupati distinct in doua grupuri majore de virusi. Interesant este faptul ca aceasta grupare valideaza abordarea noastra, deoarece aceste clustere sunt in concordanta cu proprietatile biologice ale virusurilor: Grupul # 1 corespunde tuturor virusurilor ARN ss catene pozitive in timp ce Grupul # 2 corespunde cadenelor negative ssVirusii ARN. Fiecare grup trebuie sa treaca prin cai evolutive diferite care sa duca la modelul lor distinct in utilizarea tetra-nucleotidelor. Clasificarea pentru cele doua grupuri principale de virusi (virusi ARN ss catena pozitiva / negativa ) demonstreaza un nivel de congruenta cu taxonomia virusurilor [20] si a indicat ca exista un semnal de relatie in tiparele de utilizare a tetra-nucleotidelor.

figura 1

Doi copaci de relatie pe baza coeficientilor de corelatie a prejudecatii utilizarii tetra-nucleotidelor Arborele distantei pentru 31 de virusi ARN pe baza modelului de utilizare a tetra-nucleotidelor pentru intregul genom (dreapta) si enzima de replicare (stanga). Distantele de corelatie sunt afisate deasupra fiecarei ramuri.

In ambii arbori de relatie, virusul encefalomielitei aviare (AEV), virusul care ridica lactatul dehidrogenaza (LDV), virusul sindromului reproductiv si respirator porcin (PRV), virusul arteritei ecvine (EV1), virusul bolii hemoragice de iepure (RHV), virusul febrei galbene (RHV) YFV), sunt grupul cel mai exterior de virusi, care prezinta diferente in tiparul lor de utilizare a tetra-nucleotidelor. Din familia de fire pozitive ssVirusii ARN, virusurile Corona formeaza cel mai mare cluster. SARS-CoV se gaseste in pozitia bazala a altor tipuri de CoronaVirus si ramane cel mai apropiat de virusul gastroenteritei transmisibile (TGV) si CoronaVirus felin (FCoV). Aceasta plasare este in concordanta cu concluziile din doua lucrari fundamentale [9, 10] in care SARS-CoV a fost clasificat intr-un grup separat de restul virusurilor Corona cunoscute. xxx curve din romania In plus, ambii arbori la distanta au sugerat ca Virusul CoronaVovinic Bovin (BCoV) si Virusul Hepatitei Soarecelui (MHV) ar trebui grupate impreuna, in timp ce Virusul CoronaVirus 229E (HCoV) uman este cel mai apropiat de virusul diareei epidemiei porcine (PDV). Pentru familia catenelor negative ssVirusii ARN, exista doua clase evidente care au evoluat prin diferite ramuri ale tiparului de utilizare a cuvintelor. Prima clasa acopera virusul Hantaan (HV1), virusul Reston Ebola (REV), virusul febrei efemere bovine (BFV), virusul respirator sincitial bovin (BRV), virusul respirator sincitial (RSV) si virusul respirator sincitial uman (HRV). Cea de-a doua clasa acopera virusul ARN ss catena negativa ramasa .

Abordarea a doua – Relatia de secventa a virusilor pe baza factorilor modelului de utilizare a tetra-nucleotidelor [21-23]

Modelul general de utilizare a tetra-nucleotidelor (fisierul suplimentar 2) a fost descompus in mai multi vectori proprii folosind un algoritm de analiza a factorilor. Acestea sunt componentele necorelate ale modelului de utilizare original incorporat in modelul general de utilizare a tetra-nucleotidelor. Au fost retinuti trei vectori proprii, care transporta 83,3% din varianta pentru modelele de utilizare a tetra-nucleotidelor virale (Figura 2). Din figurile tridimensionale (Figura 3, Figura 4, Figura 5 si Figura 6) reprezentate grafic impotriva acestor vectori proprii retinuti, virusii ARN ss din catena negativa au iesit clar din catena pozitiva ssVirusii ARN. Acest lucru este cel mai evident atunci cand axele de proiectie erau vectorii proprii 1 si 3. Acest lucru a indicat faptul ca ambele tipuri de virusi au o componenta complexa a tiparelor de utilizare a tetra-nucleotidelor si ca aceste tipare se modifica cu diferite familii de virusi.

Figura 2

Relatia dintre numarul de vectori proprii retinuti si procentul de varianta pe care il reprezinta in intregul model de utilizare pentru 31 de virusi. Deoarece fiecare factor consecutiv este definit pentru a identifica un model de utilizare care nu este capturat de vectorii proprii precedenti, fiecare factor consecutiv este, prin urmare, independent unul de celalalt. In plus, ordinea pentru vectorii proprii consecutivi este extrasa cu o importanta scazuta.

Figura 3

Grafic 3-D pentru profilarea vectoriala a fiecarui virus pe cei trei vectori proprii. Modelele de utilizare a tetra-nucleotidelor V pentru cadrul de citire deschis al replicazei in fiecare virus au fost redifinite pe a doua, a doua si a treia axa vector autogen („o” reprezinta catena pozitiva SS ARN virus; x reprezinta catena negativa ss virus ARN). Cele doua familii de virusi s-au grupat in doua regiuni diferite ale complotului. dame de companie ploiest

Figura 4

Graficele 2-D pentru Figura 3 cu specificatii diferite ale punctului de vedere. Modelele de utilizare a tetra-nucleotidelor pentru cadrul de citire deschis al replicazei in fiecare virus au fost redifinite pe (1 vs 2), (1 vs 3) si (2 vs 3) axe vector vector propriu („o” reprezinta catena pozitiva SS ARN virus; ‘x’ reprezinta firul negativ ssVirusul ARN). Pentru cifra de sus, comanda pentru „o” este [15,17,12,16,8,14,9,11,13,4,7,3,10,6,2,5,1] * (stanga la dreapta), in timp ce „x” este [24,27,25,28,22,26,18,23,20,19,21] * (de la stanga la dreapta). Pentru cifra din mijloc, ordinea pentru „o” este [15,17,12,16,8,14,9,11,13,4,7,3,10,6,2,5,1] * (stanga la dreapta), in timp ce ‘x’ este [24,27,25,28,22,26,18,23,20,19,21] * (de la stanga la dreapta). Pentru figura de jos, comanda pentru „o” este [15,17,12,16,8,14,9,11,13,4,7,3,10,6,2,5,1] * (stanga la dreapta), in timp ce ‘x’ este [24,27,25,28,22,26,18,23,20,19,21] * (de la stanga la dreapta). * Virusul corespunzator pentru fiecare numar urmeaza Figura 3.

Figura 5

Grafic 3-D pentru profilarea vectoriala a fiecarui virus pe cei trei vectori proprii. Tabelul cu modele de utilizare a tetra-nucleotidelor din fisierul suplimentar 2 (intregul genom) pentru fiecare virus a fost redisplayat pe axa 1, 2 si 3 eigen-vector („o” reprezinta catena pozitiva SS ARN virus; „x” reprezinta catena negativa ss virus ARN). Cele doua familii de virusi s-au grupat in trei regiuni diferite ale complotului.

Figura 6

Graficele 2-D pentru Figura 5 cu specificatii diferite ale punctului de vedere. Tabelul cu modele de utilizare a tetra-nucleotidelor din fisierul suplimentar 2 (intregul genom) pentru fiecare virus a fost redisfacut pe (1 vs 2), (1 vs 3) si (2 vs 3) axe vector vector propriu („o” reprezinta catena pozitiva ss virusul ARN, „x” reprezinta catena negativa ssVirusul ARN). Pentru cifra de sus, comanda pentru „o” este [3,7,1,4,2,5,6,17,13,20,10,16,9,8,11,15,12,14,18 , 19] * (de la stanga la dreapta), in timp ce „x” este [26,22,30,23,24,28,31,27,25,29,21] * (de la stanga la dreapta). Pentru cifra de mijloc, ordinea pentru „o” este [3,7,1,4,2,5,6,17,13,20,10,16,9,8,11,15,12,14,18 , 19] * (de la stanga la dreapta), in timp ce „x” este [26,22,30,23,24,28,31,27,25,29,21] * (de la stanga la dreapta). Pentru cifra de jos, comanda pentru „o” este [3,7,1,4,2,5,6,17,13,20,10,16,9,8,11,15,12,14,18 , 19] * (de la stanga la dreapta), in timp ce „x” este [26,22,30,23,24,28,31,27,25,29,21] * (de la stanga la dreapta). * Virusul corespunzator pentru fiecare numar urmeaza Figura 5.

In rezultatul bazat pe secventa enzimatica de replicare (Figura 3 si Figura 4), am observat o divizare clara intre doua familii principale de virusi ARN ( virusul ARN ss catena pozitiva / negativa ). experientele unei escorte online Toti virusii care apartin unei anumite familii au fost grupati strans. Acest lucru a indicat o ipoteza interesanta ca secventa enzimatica de replicare intre virusii ARN strans inruditi adopta un model comun de utilizare a cuvintelor care sunt strans legate. In plus, este clar ca virusii din diferite grupuri familiale adopta o strategie diferita de utilizare a cuvintelor.

Cu toate acestea, in Figura 5 si Figura 6, atunci cand proiectam modelele de utilizare a tetra-nucleotidelor (intregul genom) pentru fiecare virus pe axa 1, 2 si 3 eigen-vector, separarea dintre virusi a aratat un rezultat diferit atunci cand V a fost derivat din intregul genom. Cele doua familii principale de virusi au fost grupate in trei clustere, doua fiind alocate virusilor ARN ss catena pozitiva . Este deosebit de interesant faptul ca toti virusii din coltul din stanga sus corespundeau virusilor care provin din familia CoronaVirus. In mod neasteptat, virusul Hantaan (HV1) este singurul virus ARN ss cu catena negativa care are o incarcare ridicata pe vectorul propriu care a corespuns modelului de utilizare a tetra-nucleotidelor pentru catena pozitiva ss Virusii ARN.

Este important sa ne dam seama ce factor de analiza va oferi si cum aceasta analiza este diferita de metoda anterioara de generare a arborelui de relatii folosind coeficientul de corelatie. Pentru metoda anterioara care se bazeaza pe coeficientul de corelatie al modelelor de utilizare a cuvintelor, trateaza profilarea vectoriala V pentru fiecare virus ca o entitate intreaga. Cu toate acestea, analiza factoriala a considerat profilarea vectoriala Vca o suprapunere a multor modele care pot fi separate in modele de utilizare a cuvintelor necorelate reciproc. Fiecare vector propriu reprezinta componenta incorporata a tiparelor de utilizare a cuvantului ARN comunizate de un grup de virusi probabil sub aceleasi presiuni de selectie. Prin proiectarea tiparelor generale de utilizare pe acesti vectori proprii, este posibil sa se determine un grup de virusi care adopta o strategie comuna de utilizare a cuvintelor.

Concluzie

Folosind cele doua abordari pentru a studia modelul de utilizare a tetra-nucleotidelor la virusurile ARN, am ajuns la urmatoarele concluzii:

  1. 1.

    Pe baza corelatiei tiparelor generale de utilizare a tetra-nucleotidelor, virusul gastroenteritei transmisibile (TGV) si virusul coronar felin (FCoV) sunt cele mai apropiate de SARS-CoV.

  2. 2.

    Pe baza celor mai semnificativi trei vectori proprii, genomii virusilor din aceeasi familie se conformeaza unui model similar de utilizare a tetra-nucleotidelor, indiferent de dimensiunea genomului lor. anunturi matrimoniale olx

  3. 3.

    Studiul utilizarii cuvintelor este o metoda puternica de clasificare a virusilor ARN. Congruenta arborilor de relatie cu clasificarea cunoscuta indica faptul ca exista semnale filogenetice in tiparele de utilizare a tetra-nucleotidelor, iar acest semnal este cel mai proeminent in cadrele de citire deschise replicaza.

Metode

Set de date

Ne-am concentrat studiul asupra secventelor genomice (catena tradusa) a virusurilor ARN ss (Tabelul 1), care a incorporat 20 de specii din familia virusurilor ARN ss catena pozitiva si 11 specii din familia catenelor negative ssVirusii ARN. Suntem constienti de faptul ca acesti virusi constituie specii complet diferite, cel mai probabil fara legatura una cu alta. Acestea sunt incluse intr-un studiu comun pentru a incerca sa aiba mijloace de identificare a trasaturilor relevante din proprietati de fond pur statistice. Acoperirea a inclus virusii despre care se stie ca provoaca boli gazdelor corespunzatoare. Acronimul pentru fiecare virus este prezentat in tabel si este mentionat pe parcursul acestui studiu. Toate secventele corespunzatoare catenei lor traduse au fost preluate de la GenBank, iar numerele de acces si dimensiunea genomica (in nucleotide) pentru virus individual au fost furnizate pentru referinta. Pentru prezentul studiu, au fost generate doua seturi de date din secventa completa pentru fiecare virus. Setul de date 1 acoperea intregul genom, iar setul de date 2 acoperea doar cadrul de citire deschis al replicazei.

Figura 7

Organigrama pentru studierea modelului de utilizare a tetra-nucleotidelor. Algoritmii FA si NJ reprezinta analiza factorilor [21-23] si algoritmul de alaturare a vecinilor [29].

Hardware si software pentru computer

Sun Fire 6800 Server cu 24 de procesoare (fiecare ruleaza cu o viteza de ceas de 900 MHz) a fost utilizat pe tot parcursul acestui studiu. Calculul coeficientului de corelatie si algoritmul de analiza a factorilor au fost implementate folosind limbajul de programare tehnica Matlab.

Metoda de numarare a frecventei de aparitie a cuvintelor ARN

Este necesar sa abordam intrebarea cum am numarat numarul de timp in care a aparut fiecare tetra-nucleotida (de exemplu „GAGA” sau orice alta tetra-nucleotida) intr-un genom dat. curve pantelimon Pentru acest studiu, am adoptat conventia de a nu numara cuvintele suprapuse [24]. Luati ca exemplu o secventa „UAUGAGAGAUCCGAGA”. Cu cuvintele suprapuse secundare sau mai mari care nu sunt numarate, tetra-nucleotida „GAGA” este considerata ca avand loc doar de doua ori, si anume in pozitiile 4-7 si 13-16. Pozitiile 6-9 sunt omise deoarece se suprapun cu „GAGA” in pozitia 4-7.

Cu toate acestea, atunci cand am numarat tetra-nucleotida „UGAG”, pozitia 3–6 ar fi inregistrata si ca pozitia 4–6 inregistrata deja la numararea tetra-nucleotidei „GAGA”. Pe scurt, toate numararile de frecventa ale tetra-nucleotidei au fost incepute din nou cand am trecut de la numararea frecventei unei tetra-nucleotide la alta; aceasta a fost pentru a pastra corelatia tetra-nucleotidelor care au un sub-cuvant suprapus (de exemplu: „UAGA” si „GACA”). Un tabel care prezinta frecventele tetra-nucleotidelor este prezentat in fisierul suplimentar 2.

Profilarea vectoriala (V) a modelului de utilizare a cuvantului genomului ARN viral

S-a sugerat ca compozitia nucleotidica este o caracteristica specifica in diferite filogenii ale virusului [25]. Deoarece majoritatea genomilor virali sunt scurti si pentru ca ne lipseste o informatie prealabila cu privire la tempoul si modurile de evolutie a virusurilor ARN, am procedat dupa cum urmeaza. Am creat un vector, V = [C1, C2, … Ci, … Ck], fiecare element reprezentand frecventa pentru un cuvant ARN specific de lungime n . matrimoniale vn Numarul de componente ( k ) in V creste exponential cu dimensiunea cuvantului ( n ) – k = 4n. Pentru a utiliza V pentru discriminarea intre virusi, trebuie indeplinite doua criterii. In primul rand, V trebuie sa contina suficiente componente (di-nucleotidak = 16; tri-nucleotida k = 64; tetra-nucleotida k = 256); in al doilea rand, frecventele pentru tetra-nucleotide trebuie sa prezinte o tendinta proeminenta (supra / subreprezentare) care este unica pentru o familie de virusi.

Pentru primele criterii, exista argumente pro si contra pentru alegerea cuvintelor mai lungi sau mai scurte. Atunci cand sunt folosite cuvintele mai scurte, ele mostenesc problema reprezentarii inadecvate a genomului viral, deoarece motivele lungi vor fi neglijate. Dar cuvintele mai scurte au avantajul de a economisi timp de calcul. Pe de alta parte, atunci cand sunt folosite cuvintele mai lungi, acestea cauzeaza o problema de tractabilitate a computerului datorita unui set de cuvinte mai mare de explorat ( k= 4n). Cu toate acestea, cuvintele mai mari au un avantaj de a tine cont de corelatia sub-cuvintelor lor. In schimb, numarul aparitiilor lor scade rapid, impiedicand o analiza statistica precisa. Am ales tetra-nucleotidele pentru studiul nostru, deoarece acestea furnizeaza 256 de componente vectoriale (fisier suplimentar 2) si explica corelatia sub-cuvintelor pana la ordinea trei.

Pentru al doilea criteriu, a fost examinata tendinta in utilizarea cuvantului ARN. Tendinta de utilizare a cuvantului (de dimensiunea n ) este influentata de tendinta cuvantului cu dimensiuni mai mici de n [26].



  • escorte baia
  • escorte cernavoda
  • curve din giurgiu
  • fete din galati curve
  • matrimoniale rusia
  • olx dame de companie
  • curve line png
  • escorte in alexandria
  • matrimoniale republica moldova
  • studente curve bucuresti
  • escorte sv
  • escorte oana sibiu
  • dame de companie in iasi
  • sexy escorte
  • curve filmate cu camera ascunsa
  • escorte calimanesti
  • unde gasesti curve in brasov
  • escorte mature timisoara
  • jurnalul unei curve
  • matrimoniale dambovita





Prin urmare, pentru a evalua adevarata distorsiune a dimensiunii cuvantului m , este necesar sa se compare frecventele de utilizare a cuvintelor in secventa originala cu cea a cromozomilor model care iau in considerare prejudecatile dimensiunii cuvintelor m – 1, m – 2. .. 1. escorte sebes Acesti cromozomi model au fost generati prin respectarea modelului Markov de ordinul ( m – 1) th. Acest lucru poate fi realizat amestecand nucleotide virale m – 1 ca o unitate intreaga, astfel incat succesiunile nucleotidice la ordinea ( m– 1) a fost pastrata. Au fost propuse mai multe abordari statistice pentru cuantificarea prejudecatilor cuvintelor [27, 28]. In acest studiu, am folosit statistici z (ecuatia 1) pentru prejudecati di-nucleotidice si tetra-nucleotidice [27, 28]. Valoarea z este o masura a prejudecatii unui cuvant, cu valori apropiate de zero, ceea ce inseamna lipsa de partinire, valori negative care inseamna subreprezentare si valori pozitive care inseamna supra-reprezentare a cuvantului w in textul ARN.

unde w este un cuvant de marime m ; N ( w ) se observa numar in ARN-ul viral real; E ( w ) si Var ( w ) sunt asteptate numar si varianta pentru w derivate din cei 100 de cromozomi artificiali care au pastrat succesiunea nucleotidica pana la ordinea m – 1.

Abordarea unu – relatia de secventa a virusilor pe baza corelatiei biasului tetra-nucleotidic

Un parametru invariant la scara, coeficientul de corelatie r , a fost folosit pentru a compara intre modelele de utilizare a cuvintelor de virusi. Coeficientul de corelatie r masoara gradul de relatie liniara dintre doi vectori. Aici, cei doi vectori sunt modelul V de utilizare a cuvantului tetra-nucleotidic corespunzator fiecarui genom viral. Marimea lui r ar indica cat de mult din schimbarea modelului in utilizarea cuvantului tetra-nucleotidic intr-un virus se explica prin schimbarea in altul. Marimea lui reste intotdeauna intre -1 si +1, iar relatia dintre cele doua variabile va aborda liniaritatea perfecta, deoarece magnitudinea coeficientului de corelatie se apropie de valorile extreme (+/- 1). Cu toate acestea, corelatia pozitiva perfecta ( r = 1) nu inseamna identitate a V i asociata , ci, mai degraba, identitate pana la liniaritate pozitiva, adica identitate intre valorile standardizate asociata. Aceasta este o proprietate cruciala a lui r (invariant la scara) care permite compararea genomului viral in ciuda diferentelor lor in dimensiunile genomice. Magnitudinea pozitiva a lui r indica asocierea pozitiva, in timp ce magnitudinea negativa a lui rindica asocierea negativa intre doua modele de utilizare. Pentru acest studiu, coeficientul de corelatie, r , sa presupunem virusul 1 si virusul 2, este definit dupa cum urmeaza:

unde V1 , V2 sunt vectori reprezentand modelul de utilizare a tetra-nucleotidelor; S V 1 si S V 2 deviatia standard a lui V 1, V 2; sunt media lui V 1, V 2.

Apoi, distanta dintre modelele de utilizare a tetra-nucleotidelor a doi virusi este definita dupa cum urmeaza:

Distanta D ij = 1 – r ij ; (3)

unde D ij este distanta dintre modelele de utilizare a tetra-nucleotidelor virusului i si virusului j; r ij este coeficientul de corelatie dintre modelele de utilizare a tetra-nucleotidelor virusului i si virusului j

Inainte de construirea unui arbore de relatie, a fost construita matricea de distanta pereche M de dimensiunea 31 cu 31 (a se vedea fisierul suplimentar 3). curve suceava Distanta dintre perechi intre doi genomi virali este masurata prin valoarea (1 – r ). Fiecare rand / coloana corespunde unui virus specific si o intrare la intersectia randului X si coloanei Y corespunde distantei dintre virusul X si virusul Y. O astfel de matrice are o intrare diagonala de valoare 0. In scopul construirii unui arbore de relatie , este necesara doar matricea triunghiulara inferioara / superioara a lui M. Dupa obtinerea matricei triunghiulare inferioara / superioara a lui M, algoritmul metodei de imbinare vecina (NJ) a fost utilizat pentru a construi arborele relatiei (Figura 1). Metoda de imbinare a vecinilor se bazeaza pe principiul distantei minime. Detalii despre algoritmul NJ sunt disponibile in [29].

Abordarea doua – relatia de secventa a virusilor pe baza factorilor modelului de utilizare a tetra-nucleotidelor

Analiza factoriala este o metoda statistica care releva modele mai simple intr-un set complex de modele de utilizare a tetra-nucleotidelor V (fisier suplimentar 2). Se cauta sa descopere daca tiparele de utilizare observate pot fi explicate in termeni de numar mult mai mic de seturi de modele necorelate numite factori (vectori proprii). Sa presupunem ca luam un caz simplu in care exista 31 de virusi, fiecare reprezentat de doua componente (x, y) in vectorul V(x, y reprezinta frecventele de aparitie pentru doua tetra-nucleotide specifice). Apoi, intr-un grafic de dispersie ne putem gandi la linia de regresie ca la axa X originala, rotita astfel incat sa se apropie de linia de regresie. Acest tip de rotatie maximizeaza varianta variabilelor (x, y) pe vectorul propriu. Variabilitatea ramasa in jurul acestui prim vector vector a fost capturata in vectorii proprii ulteriori. In acest mod, se extrag vectorii proprii consecutivi, dar cu o importanta in scadere. Ceea ce reprezinta fiecare vector propriu este modelul de utilizare a cuvantului ARN incorporat comunizat de un grup de virusi probabil sub aceleasi presiuni de selectie.

Am implementat algoritmul de analiza a factorilor [21-23] in Limbajul de programare tehnica Matlab si am calculat un set de vectori proprii. curve decebal Apoi, modelul de utilizare original V a fost re-mapat pentru fiecare virus pe noul sistem de coordonate pe baza acestor vectori proprii derivati. Diferenta dintre abordarea doi si abordarea unu este discutata in sectiunea de rezultate si discutii.

Referinte

  1. 1.

    Numar cumulativ de cazuri probabile raportate de SARS [http://www.who.int/csr/sarscountry/en/]

  2. 2.

    Fouchier RA, Kuiken T, Schutten M, Van Amerongen G, Van Doornum GJ, Van Den Hoogen BG, Peiris M, Lim W, Stohr K, Osterhaus AD: Etiologie: postulatele lui Koch indeplinite pentru virusul SARS. Nature 2003, 423 (6937): 240. 10.1038 / 423240a

    Articol CAS PubMed Google Scholar 

  3. 3.

    Hoey J, Maskalyk J: actualizare SARS. CMAJ 2003, 168 (10): 1294–5.

    PubMed Central PubMed Google Scholar 

  4. 4.

    James JS: Informatii web SARS. News Treat AIDS 2003, (390): 6.

  5. 5. intalniri curve

    Actualizari de situatie – SARS [http://www.who.int/csr/sars/archive/en/]

  6. 6.

    Drosten C, Gunther S, Preiser W, Van Der Werf S, Brodt HR, Becker S, Rabenau H, Panning M, Kolesnikova L, Fouchier RA, Berger A, Burguiere AM, Cinatl J, Eickmann M, Escriou N, Grywna K, Kramme S, Manuguerra JC, Muller S, Rickerts V, Sturmer M, Vieth S, Klenk HD, Osterhaus AD, Schmitz H, Doerr HW: Identificarea unui nou virus Corona la pacientii cu sindrom respirator acut sever. N Engl J Med 2003, 348 (20): 1967–76. 10.1056 / NEJMoa030747

    Articol CAS PubMed Google Scholar 

  7. 7.

    Van Vugt JJ, Storgaard T, Oleksiewicz MB, Botner A: recombinarea ARN-ului de inalta frecventa in virusul reproducator porcin si sindromul respirator apare preferential intre secventele parentale cu asemanare mare. J Gen Virol 2001, 82 (Pt 11): 2615-20.

    Articol CAS PubMed Google Scholar 

  8. 8.

    Lerner DL, Wagaman PC, Phillips TR, Prospero-Garcia O, Henriksen SJ, Fox HS, Bloom FE, Elder JH: Frecventa mutatiei crescuta a virusului imunodeficientei feline lipsite de dezoxiuridin-trifosfataza functionala. Proc Natl Acad Sci SUA 92 (16): 7480-4. 1995 1 august

  9. 9.

    Marra MA, Jones SJ, Astell CR, Holt RA, Brooks-Wilson A, Butterfield YS, Khattra J, Asano JK, Barber SA, Chan SY, Cloutier A, Coughlin SM, Freeman D, Girn N, Griffith OL, Leach SR, Mayo M, McDonald H, Montgomery SB, Pandoh PK, Petrescu AS, Robertson AG, Schein JE, Siddiqui A, Smailus DE, Stott JM, Yang GS, Plummer F, Andonov A, Artsob H, Bastien N, BeRNArd K, Booth TF , Bowness D, Drebot M, FeRNAndo L, Flick R, Garbutt M, Gray M, Grolla A, Jones S, Feldmann H, Meyers A, Kabani A, Li Y, Normand S, Stroher U, Tipples GA, Tyler S, Vogrig R, Ward D, Watson B, Brunham RC, Krajden M, Petric M, Skowronski DM, Upton C, Roper RL: Secventa genomului virusului Corona asociat SARS. Stiinta 2003, 300 (5624): 1399–404. 10. matrimoniale sex bucuresti 1126 / science.1085953

    Articol CAS PubMed Google Scholar 

  10. 10.

    Rota PA, Oberste MS, Monroe SS, Nix WA, Campagnoli R, Icenogle JP, Penaranda S, Bankamp B, Maher K, Chen MH, Tong S, Tamin A, Lowe L, Frace M, DeRisi JL, Chen Q, Wang D , Erdman DD, Peret TC, Burns C, Ksiazek TG, Rollin PE, Sanchez A, Liffick S, Holloway B, Limor J, McCaustland K, Olsen-Rassmussen M, Fouchier R, Gunther S, Osterhaus AD, Drosten C, Pallansch MA , Anderson LJ, Bellini WJ: Caracterizarea unui nou CoronaVirus asociat cu sindromul respirator acut sever. Science 2003, 300 (5624): 1394–9. 10.1126 / science.1085952

    Articol CAS PubMed Google Scholar 

  11. 11.

    Ksiazek TG, Erdman D, Goldsmith CS, Zaki SR, Peret T, Emery S, Tong S, Urbani C, Comer JA, Lim W, Rollin PE, Dowell SF, Ling AE, Humphrey CD, Shieh WJ, Guarner J, Paddock CD , Rota P, Fields B, DeRisi J, Yang JY, Cox N, Hughes JM, LeDuc JW, Bellini WJ, Anderson LJ: Un nou CoronaVirus asociat cu sindromul respirator acut sever. N Engl J Med 2003, 348 (20): 1953–66. 10.1056 / NEJMoa030781

    Articol CAS PubMed Google Scholar 

  12. 12.

    Hacker J, Carniel E: Fitness ecologic, insule genomice si patogenitate bacteriana. O viziune darwiniana asupra evolutiei microbilor. EMBO Rep 2001, 2 (5): 376–81.

    Articolul PubMed Central CAS PubMed Google Scholar 

  13. 13.

    van Hemert FJ, Berkhout B: Tendinta cadrelor de citire deschise lentivirale de a deveni bogate in A: constrangeri impuse de organizarea genomului viral si disponibilitatea ARNt celular. curve din galati J Mol Evol 1995, 41 (2): 132–40.

    Articol CAS PubMed Google Scholar 

  14. 14.

    Hubacek J: Functia biologica a metilarii ADN-ului. Folia Microbiol (Praha) 1992, 37 (5): 323-9.

    Articol CAS Google Scholar 

  15. 15.

    Karlin S, Doerfler W, Cardon LR: De ce este suprimata CpG in genomul practic al tuturor virusurilor eucariote mici, dar nu si in cele ale virusurilor eucariote mari? J Virol 1994, 68 (5): 2889-97.

    PubMed Central CAS PubMed Google Scholar 

  16. 16.

    Gantt RR, Stromberg KJ, Montes de Oca F: ARN metilaza specifica asociata cu virusul mieloblastozei aviare. Natura 1971, 234: 35–37.

    Articol CAS PubMed Google Scholar 

  17. 17.

    Frederico LA, Kunkel TA, Shaw BR: Un test genetic sensibil pentru detectarea dezaminarii citozinei: determinarea constantelor de viteza si a energiei de activare. Biochimie 2001, 29 (10): 2532-7.

    Articol Google Scholar 

  18. 18.

    Bibillo A, Figlerowicz M, Ziomek K, Kierzek R: Hidroliza neenzimatica a oligoribonucleotidelor. VII. Elemente structurale care afecteaza hidroliza. anunturi matrimoniale buzau Nucleozide Nucleotide Acizi nucleici 2000, 19 (5-6): 977-94.

    Articol CAS PubMed Google Scholar 

  19. 19.

    Beutler E, Gelbart T, Han JH, Koziol JA, Beutler B: Evolutia genomului si a codului genetic: selectie la nivel dinucleotidic prin metilare si scindare poliribonucleotidica. Proc Natl Acad Sci SUA 1989, 86 (1): 192–6.

    Articolul PubMed Central CAS PubMed Google Scholar 

  20. 20.

    Regenmortel MHV, van Fauquet CM, Episcopul DHL, Carstens EB, MK Estes, Lemon SM, Maniloff J, MA Mayo, McGeoch DJ, Pringle CR, Wickner RB: . Taxonomia virusurilor: clasificarea si nomenclatura virusurilor. Al saptelea raport al Comitetului international pentru taxonomia virusurilor Academic Press, San Diego 2000.

    Google Scholar 

  21. 21.

    Bartholomew DJ: Analiza factorilor pentru date categorice, Jurnalul Societatii Regale de Statistica. Seria B (metodologica). 1980, 42 (3): 293-321.

    Google Scholar 

  22. 22.

    Kim J, Mueller Charles W: Introducere in analiza factoriala: Ce este si cum se face Newbury Park, CA: Sage Publications 1978.

    Google Scholar 

  23. 23.

    Bartholomew DJ: Analiza factorilor pentru date categorice, Jurnalul Societatii Regale de Statistica. escorte in arad Seria B (metodologica). 1980, 42 (3): 293-321.

    Google Scholar 

  24. 24.

    Ewens WJ, Grant GR: . Metode statistice in bioinformatica Springer-Verlag New York, Inc., New York 2001.

    Capitolul Google Academic 

  25. 25.

    Bronson EC, Anderson JN: Compozitia nucleotidica ca forta motrice in evolutia retrovirusurilor. J Mol Evol 1994, 38 (5): 506-32.

    Articol CAS PubMed Google Scholar 

  26. 26.

    Rocha EP, Viari A, Danchin A: Oligo-nucleotide bias in Bacillus subtilis: general trends and taxonomic comparison. Nucleic Acids Res 1998, 26 (12): 2971-80. 10.1093 / nar / 26.12.2971

    Articolul PubMed Central CAS PubMed Google Scholar 

  27. 27. dame de companie maramures

    Leung MY, Marsh GM, Speed ​​TP: Suprareprezentarea si subreprezentarea cuvintelor ADN scurte in genomii herpesvirusului. J Comput Biol 1996, 3 (3): 345-60.

    Articolul PubMed Central CAS PubMed Google Scholar 

  28. 28.

    Schbath S, Prum B, de Turckheim E: motive exceptionale in diferite modele de lant Markov pentru o analiza statistica a secventelor ADN. J Comput Biol 1995, 2 (3): 417-37.

    Articol CAS PubMed Google Scholar 

  29. 29.

    Saitou N, Nei M: Metoda de imbinare a vecinilor: o noua metoda de reconstructie a copacilor. Mol Biol si Evol 1987, 4: 406-425.

    CAS Google Scholar 

Descarcati referintele

Multumiri

Un sprijin indispensabil a fost oferit de bursa de doctorat de la Universitatea din Hong Kong (HKU). Dorim sa multumim Fondului pentru inovare si tehnologie din Hong Kong pentru sprijinirea activitatii din amonte a prezentului studiu, care a facut posibila intr-un moment in care neasteptatul focar SARS a ajuns la Hong Kong. In cele din urma, dorim sa-i multumim dr. Ralf Altmeyer pentru interesul sau critic pentru aceasta lucrare, deoarece a venit in fruntea Centrului de Cercetare HKU-Pasteur.

Informatia autorului

Afilieri

  1. Centrul de cercetare HKU-Pasteur, cladirea Dexter HC Man, 8 Sassoon Road Pokfulam, Hong Kong

    Yee Leng Yap si Xue Wu Zhang

  2. Institutul Pasteur, Unite de Genetique des Genomes Bacteriens, 28 rue du Docteur Roux, 75724, Paris Cedex 15, France

    Antoine Danchin

autorul corespunzator

Corespondenta cu Yee Leng Yap.

Informatii suplimentare

Contributiile autorilor

YLY a participat la proiectare si a efectuat analiza statistica.

AD a participat la proiectarea si coordonarea generala a acestui studiu.

XWZ a participat la proiectarea studiului. curve in otopeni

Toti autorii au citit si au aprobat manuscrisul final.

Material suplimentar electronic

12859_2003_93_MOESM1_ESM.xls

Fisier suplimentar 1: Cuvantul ARN prejudecati de diferite dimensiuni in virusurile ARN. Aceste tabele prezinta prejudecatile di-nucleotidice, tetra-nucleotidice si penta-nucleotidice pentru 31 de virusi ARN. (XLS 2 MB)

12859_2003_93_MOESM2_ESM.xls

Fisier suplimentar 2: Profilarea vectoriala a modelului de utilizare a tetra-nucleotidelor in sapte virusi ARN. Frecventele tetra-nucleotidice de aparitie in sapte genomi virali. Fiecare coloana reprezinta un model de utilizare a tetra-nucleotidelor V i pentru un singur virus. Am obtinut coeficientul de corelatie (r) prin compararea oricaror doua coloane simultan. Acest parametru r indica asemanarea tiparelor de utilizare a cuvintelor in oricare doua virusi. (XLS 38 KB)

12859_2003_93_MOESM3_ESM.xls

Fisier suplimentar 3: matricele de distanta. Fiecare intrare din matricea M este calculata utilizand ecuatia 3. Coeficientul de corelatie ( r ) din ecuatia 3 este obtinut prin compararea oricaror doua coloane din tabelul cu modele de utilizare a tetra-nucleotidelor din fisierul suplimentar 2 simultan. (XLS 31 KB)

Fisierele originale ale autorilor trimise pentru imagini

Mai jos sunt linkurile catre fisierele originale trimise de autori pentru imagini.

Despre acest articol

Citati acest articol

Yap, YL, Zhang, XW si Danchin, A. Relatia SARS-CoV cu alte virusuri ARN patogene explorate prin profilarea utilizarii tetranucleotidelor. BMC Bioinformatics 4, 43 (2003). https://doi.org/10.1186/1471-2105-4-43

Descarcati citatia

  • Primit: 08 iulie 2003

  • Acceptat: 20 septembrie 2003

  • Publicat: 20 septembrie 2003

  • DOI: https://doi.org/10.1186/1471-2105-4-43

Cuvinte cheie

  • Virusul ARN
  • evolutie convergenta
  • transferul de gene orizontal
  • analiza factorilor
  • SARS