Sveiki visi, priežastingumo ieškotojai biologijoje.
Kaip sakė Teodosijus Dobžanskis:
"Niekas biologijoje neturi prasmės, išskyrus tai kas yra nušviesta evoliucijos šviesoje!”, taip kažkas vėliau pavartojo analogišką frazę filogenetinės sistematikos atžvilgiu, taikant tą patį principą evoliucinei biologijai.
Kaip mini Alec L. Panchen savo knygoje "Classification, Evolution, and the Nature of Biology": " Istoriškai taip susiklostė kad gamtininkai, kurie pateikė evoliucijos teorijas, tokie kaip Čarlzas Darvinas ir Alfredas Volesas, tai vykdė tam kad paaiškintu natūralias klasifikacijas". T.y. evoliucijos teorija išteka iš to, kokiu būdu organizmai yra susiję vieni su kitais, koks jų yra santykinis (ir absoliutus) giminingumo laipsnis. Pagal šį požymių pasiskirstymo pobūdį tarp organizmų, ir sukurtos vienijančios teorijos, nusakančios kaip tokios struktūros arba mechanizmai galėjo atsirasti natūralių procesų metu.
Tačiau, kaip atsiranda visos šios sistematikos ir ką jos realiai reiškia, bei kodėl jos mums yra tokios svarbios?
Hanno Sandvik
(2008)
iš Tromsio universiteto (Norvegija), savo straipsnyje mini kad "mąstymas medžiais" biologijoje didžiąja dalimi pakeitė mąstymą grupėmis, vystymosi mastymą ir antropocentrizmą (viskas lyginama išeinat iš žmogaus pozicijų). Tačiau, šiuo metu "mąstymas medžiais" nėra visados adekvačiai suprantamas ir daugelis biologijos studentų vis dar nemoka teisingai interpretuoti filogenetinius medžius. Populiacinis ir "medžių" mąstymas atsirado faktiškai po Č. Darvino "Apie rūšių atsiradimą" monografijos išėjimo ir buvo įtvirtintas po moderniosios evoliucinės sintezės sukūrimo, po kurios šie mastymo tipai pakeitė esencialistinis mąstymą biologijoje (egzistuoja tiktai hierarchiškai organizuotos variacijos ir nieko idealaus). Grupių mastymas evoliucinėje biologijoje buvo paremtas tuo kad sistematika buvo prilyginama klasifikacijai, kai buvo ieškomos nedalios realiai egzistuojačios grupės, kurioms priskirdavo žemesnio rango taksonus (pvz. rūšis į gentis). Mąstymas apie evoliuciją, kaip vystymosi procesą kuris turi kažkokį galutinį tikslą, pagal savo prigimti yra teleologinis. Dabartinės evoliucinės biologijos žinios paneigia šia prielaidą, nes gyvybėje matoma labiau diversifikacija nei kažkoks kryptingas kitimas "tikslingos būsenos" link.
Mes visi pripratę naudotis dar Linėjaus sukurta kategorijų sistema (rūšys, gentys, šeimos, būriai, klasės, tipai, karalystės). Tačiau visos virš-rūšinės kategorijos yra dirbtinos, ir tiesiog atspindi kad biologinė įvairovė nėra tolygiai pasiskirsčiusi požymių erdvėje o stipriai joje klasterizuojasi. Šiuo metu biologinėje sistematikoje einama ta kryptimi, kad visą biologinę įvairovę stengiamasi sistematizuoti pagal santykinę giminystę (t.y. filogenetiškai). Nes, kaip mini Džiozefas Felzenštainas (Joseph Felsenstein): "Filogenijos arba evoliuciniai medžiai bazinės struktūros, kurios būtinos tam kad galima būtu aiškiai mąstyti apie rūšių skirtumus ir analizuoti juos statistiškai". Filogenijos egzistuoja jau 150 metų (pradedant nuo Č. Darvino žymiojo darbo), tačiau statistiniai ir algoritminiai metodai - tiktai 40. Felzenštainas mini kad iki 2004 metų išėjo apie 3000 darbų (straipsnių, monografijų) skirtų filogenetinei analizei. Tuo tarpu sudarydamas šią apžvalgą, rėmiausi vos keliais apžvelgiančiais darbais, pasitelkdamas moduliacijos principą.
Paleontologai Øyvind Hammer ir David A.T. Harper (2005), rašo kad vargu ar egzistuoja tokia biologinių duomenų analizės sritys kuri būtu sužadinusi tiek prieštaros, sukūrusi tiek daug straipsnių, leidusi atsirasti naujoms karjerų galimybėms ir jas sužlugdžiusi. Remiantis filogenetine sistematika, netgi sukurta nauja alternatyvi Linėjaus sistemai
The PhyloCode sistema.
Taigi, kuo pasižymi filogenetinė sistematika, kaip ji atsirado bei kuo ji skiriasi nuo kitų sistematikos krypčių? XX a. išsiskyrė 3 sistematikos mokyklos: evoliucinė, fenetinė ir filogenetinė. Filogenetinė sistematika, kitaip nei kitos sistematikos rūšys, pripažįsta tiktai
monofiletines grupes arba taip vadinamas
kladas ( nuo to ir kilo mokslo pavadinimas). Tai yra tiktai tas grupes kuriose yra visi protėvio palikuonys. Grupė kurioje organizmai sugrupuoti pagal giminystę, tačiau turinti savo sudėtyje ne visus palikuonis skaitoma
parafiletine. O jeigu grupė yra sudaryta tiktai pagal paviršutinišką panašumą o ne pagal giminystę (t.y. nariai iš tikrųjų priklauso skirtingoms grupėms), tuomet tokia grupė vadinama
polifiletine. Jeigu žiūrėti stuburinių pavyzdžiais, tuomet monofiletine grupe galima būtu skaityti pvz. žinduolius, ropliai būtu parafilėtinė grupė, nes jų sudėtyje nėra visų jų palikuonių - paukščių ir žinduolių, taip pat parafiletinė grupė būtu - porakanopiniai, nes skirtingos jų grupėje, dažnai neįjungiami banginiai (pvz. hipopotamai artimesni banginiams nei kitiems porakanopiniams) (g-moksluose:
Evoliucija - Faktai, Faktoriai ir Atradimai ), polifilėtinė grupės pavizdys būtu XIX a. laikiti giminingais "storaodžiai" (drambliai, begemotai ir raganosiai).
Kiti svarbus terminai filogenetinėje sistematikoje susiję su analizuojamais požymiais pagal jų evoliucinę prigimtį.
Apomorfiniai požymiai - tai pažangus požymiai.
Sinapomorfiniai požymiai - tai tokie požymiai iš pažangių klasės, kurie yra pas protėvį ir jo palikuonis, ir gali būti panaudotas atrandant monofiletinę grupę.
Autapomorfija - tai pažangus požymis, kuris yra randamas tiktai vienoje rūšyje.
Pleziomorfiniai požymiai - tai primityvus požymiai, kurie be to yra randami ir išorinėse grupėse (angl.
outgroup).
Homoplazijos - požymiai kurie atsiranda filoogenijoje daugiau nei viena kartą. Apie šių požymių būsenas pasitelkiant papildomas žinias nusprendžiama prieš kladistinę analizę, išskirus homoplazijas, apie kurių buvimą sužinome po analizės.
Daugeliui yra žinoma (bei inėta šiek tiek anksčiau) kad organizmų klasifikaciją, kaip hierarchinę struktūrą pirmasis išrado Karlas Linejus. Tačiau, tikslus metodai paremti taksonų tikslia giminyste pradėti diegti tiktai po antro pasaulinio karo. Su filogenetinės sistematikos atsiradimu siejamas vokiečių biologo Vilio Henigo (
Willi Hennig ) vardas (beje jo vardu pavadinta tarptautinė kladistikos draugija -
The Willi Hennig Society ), kuris 1950 metais išleido vokiečių kalba pirmąjį kladistikos veikalą, kuris tik 1965 metais buvo išverstas į anglų kalbą. Jis pirmasis postulavo kad tiksli organizmų evoliucijos tvarka gali būti atskleista naudojantis griežtais loginiais metodais, kurie turi mažai subjektyvių prielaidų. Kaip jau ir minėta, filogenetika remiasi stiprios monofilijos idėja, į kurią šiek tiek anksčiau, pirmasis stipriai apeliavo botanikas
Walter Zimmerman (kurio žymiausias mokinys buvo jau minėtas V. Henigas). Taip pat svarbus įvykis skaitmeninių metodų įdiegime sistematikoje, buvo Sneath ir Sokal 1963 metais išleista knyga "Numerical Taxonomy", kuri be to laikoma kaip vienas iš pirmųjų darbų statistinėje klasifikacijoje ir klasterinėje analizėje. Tačiau Džiozefo Felzenštaino nuomone, filogenetinė sistematika prasidėjo nuo italų populiacinio genetiko
Luigi Luca Cavalli-Sforza ir anglų statistiko ir evoliucinio biologo
Anthony William Fairbank Edwards darbų. Jie pirmieji įvedė į sistematiką parsimonijos (šykštumo arba godumo) analizę (angl.
parsimony ), didžiausio tikėtinumo metodus (angl.
Maximum likelihood ) bei kitus svarbiausius statistinės filogenetinių medžių paieškos metodus.
Taigi, kuo bendrai skiriasi filogenetinė sistematika nuo evoliucinės ir fenetinės sistematikos (nors paskutinė, Džiozefo Felzenštaino nuomonė, irgi yra filogenezės paieškos metodas)? Evoliucinės sistematikos priėjimas, bando priskirti taksonominį rangą pagal grupės narių genealoginį giminingumą ir pagal bendrą jų panašumą arba nutolimą nuo protėvio, taigi ji leidžia egzistuoti parafilėtinėms grupėms arba gradoms (kaip pvz. ropliai, kurie turi bendrą protėvį, tačiau neturi savo sudėtyje visų palikuonių). T.y. kombinuojama klasifikacija su genealogija, tuo tarpu kitos dvi sistematikos atšakos tokio suliejimo nepripažįsta.
Fenetika savo ruožtu klasifikuoja organizmus pagal "bendrą panašumą", t.y. analizės metu lyginami ne patys požymiai ir jų pasiskirstymas tarp nagrinėjamų taksonų, o koreliacijos koeficientai (ar kiti panašumo/skirtingumo matai) tarp rūšių porų ir jau pagal juos nustatoma bendra rūšių panašumo tvarka. Šis metodas, Felzenštaino nuomone analizės metu praranda aukštesnio lygio kombinatorinę informaciją, lyginimą suvedant tiktai į vieną panašumą nurodantį skaičių tarp 2 rūšių. Tuo tarpu filogenetinė sistematika stengiasi surasti giminingumo medžius, neredukuojant požymių į bendrą panašumo koeficientą, kaip tą daro fenetiką, bei stengiasi atrasti grupių evoliucijos tvarką pagal jų giminingumą. Atsišakojimų tvarka kladogramoje atspindi genealogiją, kurios topologija atspindi evoliucinius požymių pokyčius.
Kaip ten bebūtu, visos sistematikos turi tenkinti tam tikrus kriterijus (dėl kurių dažniausiai ir atsiranda ginčai). Džefris Levintonas (Jeffrey S. Levinton, 2001) sudarė tokių kriterijų sąrašą:
- Įtikimumas. Sistema turi būti pakankamai patogi ir intuityvi, kad visi ją galėtu suprasti.
- Atitinkamumas (kongruentiškumas). Klasifikacijos kurios yra paremtos skirtingais požymiais, turi pateikti tuos pačius rezultatus
- Genealogija. Dauguma evoliucinių biologų reikalauja kad klasifikacija atspindėtu evoliucinius santykius.
- Natūralumas. Grupės turi atspindėti požymių būsenas, panaudotas sudarant klasifikaciją.
Kaip sudaromos filogenijos? Metodai.Filogenetiniams santykiams išaiškinti naudojama keliolika metodų: parsimonijos (arba minimumo evoliucijos); optimizacijos paremtos didžiausio tikėtinumo evoliuciniu modeliu; požymių suderinamumo metodas, kurio algoritmas ieško požymių aibės, kurių kitimas nėra prieštaringas; bei kai kuriais atvejais naudojamasi fenetiniais atstumais, tam kad nustatyti filogenetinius santykius. Dar kiti metodai įtraukia ne tiktai duomenys apie organizmų požymius, bet ir organizmų pasiskirstymą laike (stratofenetika ir stratokladistika). Mano metodu apžvalga, daugiausia remiasi Felzenštaino knyga "Inferring Phylogenies", todėl prisilaikysiu jo klasifikacijos:
Šykštieji (angl. parsimony) metodai:
Šių metodų klasė yra paremta hipotezių ekonomiškumo filosofija. Ji teigia kad teisingiausias yra tas modelis, kuris reikalauja mažiausio kiekio paaiškinimų (
Okamo skūstuvo principas). T.y. rūšių atsiskyrimo tvarka (medžio topologija) optimizuojama tokiu būdu, kad maksimaliai sumažinti šakų ilgį, t. y. evoliucinių virsmų bendrą kiekį medyje. Tarkim, požymis A turi dvi būsenas - 1 ir 0, ir tarkime jis gali pereiti iš vienos būsenos į kitą simetriškai (t. y. su vienoda tikimybe 0=>1 kaip ir 1=>0). Ir tarkime kad kokia nors rūšis turi požymio būseną "1". Ir optimizacijos metu surasti medžiai, kur pirmame požymis patyrė transformaciją 0=>1=>0=>1, o kitame tiktai 0=>1. Tuomet visoms kitoms lygioms galimybėms esant, bus priimtas antras medis, nes jis turi 2 evoliuciniais įvykiais trumpesni (šykštesnį) medį.
Taip pat medžių forma priklauso ne tik tai nuo medžio topologijos (santykinė atsiskyrimų tvarka) bet ir nuo to ar medis yra įšaknintas ar jis toks nėra. Įšaknintu vadinamas toks medis, kurio viena iš viršūnių priimama kaip šaknis, taip iškart medyje sudarant pokyčių kryptį. Tam kad įšaknintį medį dažniausiai "a priori" pasirenkamas taksonas, kuris kaip yra žinoma, nepriklauso nagrinėjamai grupei, tačiau vis dar yra pakankamai giminingas tam kad galėtu nurodyti analizės metu primityvius (bendrus) požymius ir suteikti medžiui kryptį (tai vadinama - požymių poliarizacija). Taip pat gali būti panaudotas molekulinis laikrodis, kuris nurodo grupių divergencijos laikus. Taip pat, svarbus medžio atributas - šakų ilgiai irgi gali skirtis netgi esant tam pačiam įšaknintam arba neįšaknintam medžiui, tiktai skirtingai išdėstant įvykių vietas (
pav1). Todėl, neturint kitų papildomų duomenų dažniausiais rekonstrukcijoje pateikiamas vidurkinis visų įmanomų variantų rezultatas (
pav2) (beje, turėkite omenyje kad pav1 ir pav2 pavaizduoti neįšakninti medžiai).
Daugybės būsenų parsimonijos metodas, kai visos būsenos su vienoda tikimybe gali pereiti viena į kitą (pvz. nukleotidai A, C, G, T) vadinamas
Vagnerio parsimonija. Pagal šį metodą, kuris pirmą kartą buvo pateiktas Fitšo (1970 m), pakitimų kiekis skaičiuojamas, kaip būsenų sankirtų kiekis, o jeigu sankirtos rezultatas yra tuščia aibė, tuomet imama būsenų sąjunga, taip įvertinant visus požymius visuose rūšyse. Yra ir kitų algoritmų, kaip pvz.
Sankoff algoritmas.
Prieš vykdant analizę, visad turi būti pasirinktas evoliucijos modelis arba prielaida apie evoliucijos procesą. T. y. mes turime numatyti kokiu būdu keitėsi požymiai, kad žinotumėme kokia turi būti baudinio funkcija. Priimant
Camin-Sokal parsimoniją, požymiai gali būti 2 būsenose "0" ir "1", ir pereina tiktai sekančiu būdu 0=>1, bet ne atvirkščiai (primityvinimo negalimumas). Kita parsimonijos rūšis yra
eiliškumo parsimonija, kai požymiai gali transformuotis tiktai tam tikra tvarka, t.y. iš eilės pereidami visas užduotas būsenas.
Dollo parsimonija, kuri yra pavadinta pagal Dolo dėsnį (
Dollo's law ), kuris teigia kad sudėtingi požymiai gali atsirasti tiktai vieną kartą, ir reevoliucionuoti į lygiai tuos pačius negali. Algoritmiškai tai skambėtu, taip: požymis filogenijoje gali atsirasti tiktai vieną kartą, bet grįžti į primityvią būseną gali daug kartų (taigi, reversijų kiekis yra minimizuojamas parametras filogenijoje).
Polimorfizmo parsimonija - paremta tuo kad populiacijose polimorfizmas nėra nepriklausomas, populiacijoje perėjimas iš būsenos "0" į būseną "1" įvyksta tiktai vieną kartą.
Daugelio būsenų binariniame kodavime parsimonija, kai kiekviena būsena sekoje gali pereiti į bet kurią kitą, tik tam tikra tvarka (pvz -1<=>0<=>1<=>2). O taip pat skirtingų požymių svertinių koeficientų nustatymas, traktuojant juos kaip nelygius.
Tam kad vykdyti efektyvią optimalių medžių paiešką, mes turime žinoti koks yra nagrinėjamos problemos sudėtingumas. Kitaip sakant -
Kiek yra medžių duotam rūšių kiekiui? Kaip mini Felzenštainas: "Tai, kiek egzistuoja filogenetinių medžių, priklauso nuo to ką mes vadinsime "filogenija" bei kurias iš jų laikyti skirtingomis." Taigi, pagrindinės kokybinės filogenetinių medžių dichotomijos:
įšakninti vs. neįšakninti,
suženklinti vs. nesuženklinti,
bifurkaciniai vs. multifurkaciniai. Apie tai kuo skiriasi įšakninti medžiai nuo neiįšakninti kalbėjome anksčiau. Suženklinti medžiai savo ruožtu skiriasi nuo nesuženklintų, tuo kad juose yra informacija ne tiktai apie medžio topologiją (taksonų atsiskyrimo tvarką) ir šakų ilgiai, bet ir tų atsiskyrimų eiliškumas laike. Kaip pavyzdį, galima pateikti du vienodos topologijos medžius, kurie skiriasi sužymėta istorija (
pav3). Bifurkaciniai medžiai, arba teisingiau sakant atsišakojimo taškai, skiriasi nuo multifurkacinių tuo kad bifurkacijos atveju iš vieno mazgo atsišakoja dvi dukterinės linijos, iš multifurkacinio daugiau (t.y. dažniausiai priimama kad tai nevisiškai išspręsta genealogija). Apibendrinus, galimų medžių kiekis yra milžiniškas ir priklausomai nuo nagrinėjamų rūšių kiekio auga greičiau nei eksponentiškai. Medžių turinčių suženklinimo, įšaknijimo ir bifurkacijos sąvybes kiekis, priklausomai nuo rūšių kiekio, lygus = (2n-3)!/((2^(n-2))*(n-2)!). Taigi, lyginant 30 rūšių, būtu ~ 5*10^38 medžių, o esant 50 rūšių būtu ~ 2,75*10^76, šis skaičius viršytu Edisono skaičių (elektronų kiekį matomoje visatoje).
Tam kad išspręsti tokio sudėtingumo problemą, pasitelkiami įvairus optimizaciniai algoritmai. Turint tam tikrą baudinio funkciją (tarkim minimumo evoliucijos). Yra pritaikomi
išsamus algoritmai, kai tiesiog perrenkami visi medžių variantai (jis tinkamas tiktai labai mažam palyginamų rūšių kiekiui), kas užtikrina globalaus optimumo radimą. Šakų ir ribų (angl.
Branch and Bound) algoritmas, kai medžio šakų ilgio skaičiavimas vykdomas, medžio sudarymo metu. Tai šiek tiek labiau užima atmintinės, tačiau leidžia iškart atmesti netinkamus medžius (jis be to naudojamas šachmatų kompiuteriniuose žaidimuose). Šis algortimas suranda artimą optimaliam sprendinį eksponentiniame laike (t.y. sprendimo trukmė priklauso nuo nagrinėjamų rūšių kiekio eksponentiškai). tai stiprus paieškos pagreitinimas, nes kaip yra įrodyta, filogenetinių medžių paieška yra
NP-hard problema, tiksliai neišsprendžiama polinominiame laike. Godus algoritmai (angl.
Greedy algorithm ), ieškantys ties kiekviena iteracija optimaliausio sprendimo ir perkeliantys ieškojimo radiuso centrą į tą tašką sekančią iteracija (gerai ieško tolygiuose funkcijose, bet gali užstrigti ties lokaliais optimumais). Įvairus medžių "kirpimo", genėjimo ir skiepijimo arba artimiausio kaimyno pakeitimo algoritmai, kurie modifikuoja esama medį, manipuliuodami jo atšakomis, bei vertindami tu manipuliacijų rezultatus. Taip pat naudojami evoliuciniai genetiniai algorimai, kurie sprendimo ieško iš populiacijos atsitiktinai "mutuojančių" bei rekombinuojančių chromosomų, kurios koduoja sprendimus, ir su kiekviena karta, veikiami natūraliosios atrankos vis labiau "prisitaiko", taip surasdami artimą optimaliam medžio konfiguracija. Aišku tų algoritmų yra visa begalė, o kai kurie, paremti stochastine optimizacija (pvz.
simulated annealing), tiktai pradėti diegti.
Taip pat svarbus dalykas kladistinėje analizėje yra požymių suderinamumas (Character compatibility). T.y. kaip požymiai susiderina su rasta filogenija. O tam kad sužinoti kurie požymiai yra labiau suderinami, surandamas jų homoplazijų (nepriklausomų atsiradimų) kiekis, kuris nurodo neatitikimo laipsnį. Požymių suderinamumo analizei vykdyti yra sukurta daug būdų (tarp jų E. O. Wilson sukurta testavimo metodika) bei grafų teorija paremti metodai. Atlikus šią analizę, mes sužinome koks yra mūsų pasirinktų požymių kongruentiškumas.
Norėtusi apžvelgti kai kurias
parsimonijos statistines savybes. Kai kurie parsimonijos apribojimai iškyla tomet kai pradedamos nagrinėti jos statistinės savybės. Būsenos perėjimo iš "0" į "1" yra (pagal Felsenstein, 2004) lygi Prob(1|0,tj) ~ 1/2*(1-e^(-2*ri*tj)), o tai kad tam tikras požymis pasikeis tam tikroje šakoje -lnL ~ sum i(sum j (nij*[-ln(ri*tj])). Taigi, požymių svoriai priklauso ne tik tai nuo pokyčių greičio "r" bet ir nuo filogenetinio medžio atšakų ilgio "t". Metodo apribojimai iškyla tuomet kai vyksta greita evoliucija ir požymiai keičia ne kartą savo būseną. Tai iš tikrųjų yra didelė problema, ypač kai rinkinyje egzistuoja greitai evoliucionuojančios rūšys. Tuomet vyksta taip vadinama "ilgų šakų trauka" (angl.
long branch attraction), kai negiminingos atšakos peršoka arčiau greitai evoliucionuojančios filogenetinės linijos.
Taip pat svarbu žinoti filogenetinių medžių neprieštaringumą (angl. consistency). Neprieštaringumas, tai toks parametras kai didinant duomenų kiekį, medžio atitikimas su tikru artėja prie tikimybės lygios "1". Felzenštainas ir Kavenderis įrodė, kad egzistuoja situacijos kuriose parsimonija yra prieštaringas metodas ir gali stipriai apsirikti. Ilgų šakų trauką atsiranda tuomet kai pokyčių kiekis išorinėse šakose "p" yra didesnis nei vidinėse atšakose "q". Rezultatai yra suderinami tuomet kai (p^2)<q(1-q). "p" ir "q" parametrų erdvės sritis (kai "p" ir "q" gali kisti (0;0,5]), kurioje vyksta ilgų šakų trauką ir parsimonija duoda blogus rezultatus, vėliau atradėjo garbei buvo pavadinta "Felzenštaino zona" (vienas iš jos variantų Jukes-Cantor nukleotidų evoliucijos modeliui -
pav4, iš Felsenstein, 2004). Taip pat neteisingi rezultatai gali gautis, kai kelios ilgos šakos yra atskirtos trumpomis atšakomis, tuomet jos dažnai tarpusavyje apsijungia. Tačiau, kuo daugiau analizėje egzistuoja požymių būsenų, tuo didesnė yra neprieštaringumo tikimybė, nes pvz. esant 2 požymių būsenom, tikimybė įgyti tą pačią būseną lygi p^2, tuo tarpu esant 4 būsenom, tikimybė yra lygi (p^2)/3. Taip pat prieštaringumas mažėja didėjant rūšių kiekiui. Yra dar išskiriama "Farris zona" arba taip vadinama "anti-Felzenštaino" zona, kai šakos su dideliu ilgiu apjungiamos tarpusavyje, parsimonijos dėka. Tačiau analizuojant toje pačioje zonoje didžiausio tikėtinumo metodais gaunami neteisingi rezultatai (tačiau tokias išvadas kritikavo pats Felzenštainas).
Tam reiškiniui spręsti kai kurie autoriai (Penny et al., ir Tuffley and
Steel - nuorodos Felsenstein, 2004) sukūrė modelius kur evoliucijos
greičiai gali stipriai varijuoti tarp atšakų (t.y. labiau
realistiškesni), pavadindami metodą - angl. No common mechanism. Kaip
pažymi Džiozefas Felzenštainas, skirtingi metodai tinka skirtingiem
duomenims. Pvz. Suderinamumo metodai, kurie suranda susiderinančių
požymių rinkinius ir pagal juos sudaro medžius labiau tinkami greitai
kintančių grupių analizei, tačiau ten turi būti nedeug homoplazijų. Tuo
tarpu parsimonijos metodai priima kad požymių kitimo greitis nėra
didelis, tačiau tarp jų gali pasitaikyti nemažai homoplazijų.
Atstumų matricų metodai: Atstumų matricų metodai yra paremti fenetinių atstumų tarp rūšių naudojimu, kai kiekviena rūšis palyginama su visom kitomis. Šis metodas yra sukurtas Cavali-Sforza ir Edwards 1967 metais, remiantis Sneath ir Sokal metodikomis (1963). Kaip anksčiau buvo manyta, šie metodai praleisdami aukštesnio lygio kombinatorinę informaciją (daugiau nei 2 rūšių savybių iškarto) turėtu būti netikslus, tačiau kaip parodė imitaciniai ir lyginamosios analizės tyrimai, šis metodas gan gerai atskleidžia giminystės ryšius. Trumpai apžvelgiant šį metodą - jis remiasi generalizuotų mažiausių kvadratų metodu (angl.
generalized least squares ), kai sumuojami neatitikimų tarp rūšių kvadratai (t.y. surandami euklidianiai atstumai). Taip surandamas didelis kiekis dviejų rūšių medžių, po to iš kurių sudaromas n-rūšių medis. Naudojantis šiuo metodu, analizuojant molekulinius (nukleininių ir aminorūgščių) duomenys, dažnai priimamos skirtingos prielaidos susijusios su molekuline evoliucija, tam kad sužinoti koks tam tikro pakitimo tikėtinumas. Tarkim, priimant Jukes-Cantor nukleotidų evoliucijos modelį, nukleotidai visuose saituose turi vienodą tikimybę pereiti į bet kurį kitą, kuri yra lygi = 1-e^(-4/3*u*t). Atstumų matricų metodai dažnai reikalauja "laikrodinio medžio" (angl. clocklike tree) prielaidos, kai visos viršūnių šakos turi vienodą ilgį (ultrametriniai medžiai). Siejant nukleininių ir aminorūgščių evoliucijos modelius, didelis minusas yra tai kad tripletai koduojantys aminorūštis gali būti labai skirtingi. Tuo tarpu aminorūgščių pakitimo į kitas aminorūgštis homologiškuose baltymų atkarpose tikimybės apskaičiuojamos pagal daugelį giminingų baltymų (
Dayhoff modelis). Modeliai, kurie remiasi antrine struktūra, naudoja struktūrinių būsenų perėjimo tikimybes iš vienos į kitą (alfa-spiralės, beta-klostė). Analizėms atlikti naudojami
UPGMA algoritmas (kuris turi vieną trūkumą - jeigu medžiai nėra laikrodiniai "trumpų šakų trauka", tuomet jis gali duoti neteisingus rezultatus); kaimynų apjungimo algoritmas (angl.
neighbor joining) o taip pat yra pasvertųjų kaimynų apjungimo algorimas (angl. wheighbor joining).
Didžiausio tikėtinumo metodai:
Didžiausio tikėtinumo metodas buvo sukurtas statistiko ir genetiko R. Fišerio XX a. pradžioje. Jis skirtas tam kad patikrinti matematinio modelio atitikimui duomenų atžvilgiu. Jeigu remtis J. Felsenstein formuluote: egzistuojant dviem duomenų pasiskirstimą "D" aiškinančioms hipotezėms H1 ir H2, didžiausio tikėtinumo principas nusako kad hipotezių santykinė aiškinamoji galia yra lygi: Prob(H1|D)/Prob(H2|D)=(Prob(D|H1)/Prob(D|H2))*(Prob(H1)/Prob(H2)). Šnekant parastai, šio metodo įdėja būtu tokia (Hammer, Harper, 2005) - turint medį A, bei evoliucijos modelį, mes galime apskaičiuoti to medžio tikėtinumą, t. y. tikimybę gauti matomą medį, esant turimiems duomenims. Po to, tiesiog išrenkamas toks medis kuris labiausiai atitinka duomenys esant tam tikram evoliucijos modeliui.
Kaip modelis gali būti naudojama molekulinio laikrodžio prielaida (bet gali būti ir kintamų greičių modelis) ir/arba perėjimo dažnių lentelės molekiliniams duomenims arba stratigrafinis atitikimas paleontologiniams duomenims. Dažniausiai molekulinio laikrodžio prielaidos laikomasi viduj-rūšiniuose tyrimuose, nes tarp rūšių ar aukštesnio rango kladų jie gali stipriai varijuoti, tuo tarpu rūšies viduje molekulinės evoliucijos greičiai daug maž panašus. Tuo tarpu tarprūšiniuose tyrimuose šiuo metu dažnai naudojami taip vadinami "relaksuoti" laikrodžiai, kai priimama kad molekulinės evoliucijos greičiai lėtai kinta einant tarp giminingų kladų.
Paleontologiniai duomenys filogenetinėje analizėje bei stratofenetinis ir stratokladistinis metodai. Paleontologiniai duomenys leidžia pamatyti šiuolaikinių rūšių protėvius, ir tokiu būdu poliarizuoti požymių būsenų evoliuciją (tai viena iš sudėtingiausių užduočių kladistikoje). Tačiau, kaip pažymėjo J. Levintonas (Levinton, 2001): " Paleontologinis metraštis buvo stebėtinai sudėtingas objektas konstruojant sistematines schemas ir nustatant evoliucinius santykius.". Dar Henigas, filogenetinės sistematikos "tėvas", manė kad fosilijų įtraukimas į filogenetines schemas gali jas destabilizuoti (na ir iš tiesu, jeigu pvz. pažiūrėti į paleontologinį metraštį, visai neaišku tampa kada mes matome vis dar roplį, o kada jau žinduolį). Tačiau šiuo metu, paleontologiniai duomenys aktyviai naudojami kaip filogenetinių medžių kūrime, taip ir jų kalibravime laiko atžvilgiu (pvz. molekulinio laikrodžio kalibravimui, M. Bentono yra paskelbtos genetinių modelinių organizmų seniausių bendrų protėvių egzistavimo datos -
Palaeontological evidence to date the tree of life. Molecular Biology and Evolution ).
Tačiau pagrindinė problema su paleontologiniais duomenimis ne sistematinių schemų nestabilumas o paleontologinio metraščio nepilnumo klausimas. Šis faktas buvo žinomas dar Č. Darvinui, kuris savo veikale turėjo atskirą skryių kuris aprašė šią problemą. Č. Darvinas žiūrėjo į paleontologinį metraštį ganėtinai pesimistiškai, protėvių atradimo klausimu, nes manė kad morfologinio kitimo netolygumai yra sukelti stipraus metraščio nepilnumo, nes teoriškai pagal jį evoliucija turėjo veikti labai lėtai. Dabar yra žinoma, kad paleontologijoje protėvio radimo tikimybė yra stipriai priklausoma nuo samplingo intensyvumo. Savo ruožtu samplingo intensyvumas priklauso nuo nagrinėjamos grupės išsisaugojimo tikimybės, pavizdžių paėmimo intensyvumo geologiniuose pjūviuse, bei uolienų kuriuose egzistavo tam tikra nagrinėjama grupė geografinio paplitimo bei laikinių spragų buvimo (tiesa sakant šias sudėtingas problemas nagrinėja atskiras mokslas -
tafonomija). Todėl kažkokio taksono, kaip protėvio tvirtinimai turi būti labai atsargus. Pvz. šiuolaikinės žmogbezdžionės (išskirus patį žmogų) beveik neturi paleontologinių radinių, todėl jų fosilijų filogenetinės interpretacijos turi būti labai atsargios. Tuo tarpu tokios organizmų grupės kaip planktonianiai foraminiferai turi tiesiog puikų paleontologinį metraštį, kuri beveik be pertraukų galima atsekti dešimtys milijonų metų atgal. Tokių organizmų liekanų interpretavimas kaip protėvių yra ganėtinai patikimas. Dauguma gi grupių turi tarpinius paleontologinio metraščio variantus.
Stratigrafijos ir nepriklausomai suratos filogenijos atitikimo tikrinimui yra sukūrti taip vadinami stratigrafiniai indeksai. Tarp jų plačiausiai naudojami - Spirmeno ranginės koreliacijos koeficientas, santikinio pilnumo indeksas, stratigrafinio atitikimo indeksas, išsisaugojimo indeksas ir kt.
Yra filogenetinės metodikos kurios ne tiktai tikrina stratigrafijos ir filogenijos atitikimą, tačiau ir įskaičiuojančios laikinį (stratigrafinį) taksonų paplitimą analizės metu. Pirmasis tokio pobūdžio metodas yra
stratofenetinė analizė, kuri 1979 metais buvo sukūrta
Philip Gingerich. Pagal šį metodą, rūšys turi būti klasterizuojamos pagal morfologinius požymius kiekviename stratigrafiniame lygyje atskirai ir kiekvieną klasterį priimant kaip atskirą rūšį. Vėliau, rūšys pasirinktame lygyje lyginamos, naudojantis tą pačia klasterine analize su artimiausių stratigrafinių lygių rūšimis. Taip vykdomas fenetinis sugretinimas tarp rūšių pavizdžiuose ir artimiausiuose sluoksniuose, tam kad galima būtu sudaryti minimalaus ilgio medį. Tačiau šis metodas turi ir minusų, nes jis gali nagrinėti rūšis tiktai artimiausiuose sluoksniuose, taigi turi prielaidą kad paleontologinis metraštis yra beveik pilnas nagrinėjamų organizmų atžviliu. Kitas svarbus metodas, sukūrtas Fisher (1991, 1992) šioje srytyje yra
stratokladistika. Šios metodikos esmė yra ta kad kartu su morfologiniais požymiais parsimonijos analizėje naudojama ir stratigrafinė rūšių padėtis. Tai yra sukūriamas dirbtinis laiko požymis, kuris gali kisti tiktai viena kryptimi (pvz. 1=>2=>3=>4=>5=>...=>N), t.y. šio požymio reversijos neleidžiamos. Taigi šis metodas ne tiktai mažina morfologinių požymių evoliucijos kiekį bet ir kartu mažina stratigrafinį rūšių pasirodymo ir filogenijos neatitikimą. Šio metodo minusas yra tas kad sunku objektyviai nustatyti laiko požymio svorį, nes jeigu mes tarkime imsime pavizdžius tankiau laiko atžvilgiu, tuomet mes tarsi sukūrsime daugiau laiko požymio būsenų, t. y. padidinsime šio požymio svorį. Dar kitų metodų grupė yra sukūrta Wagner (1998) Hueselbeck ir Rannala (1997, 2000), kuriuos galima įvardyti
stratigrafinio tikėtinumo metodais. Wagner metodas nusako turimo medžio stratigrafinį atitikimą bei į modelį įtraukia fosilijų samplingo modelį. Hueselbeck ir Rannala stratotikėtinumo metodas remiasi fosilizacijos greičiu (kaip intensyviai fosilijos patenka į pavizdžius per laiko vienetą) bei paleontologiniame metraštyje rastos rūšies matomu egzistavimo intervalo ilgiu. Tačiau, kaip rašo Felzenštainas (Felsenstein, 2004) iki šiol vis ar nėra sukūrta pilno stratigrinio tikėtinumo modelio, kuris be to įtrauktu fosilinių ir dabartinių organizmų požymių evoliucijos modelius.
Įdomus dalykas yra tas kad naudojant iškastinės DNR liekanas (pvz. mumijose) irgi galima naudotis paleontologinio samplingo metodikomis, tam kad nustatyti ar surastas individas yra protėvinis šiuolaikiniams individams. Tą patį galima daryti su greitai evoliucionuojančiais RNR virusais, kurie net žmogaus gyvenimo masteliais spėja daug nuevoliucionuoti ir pakeisti daug kartų (pvz. palyginti dabartinį kiaulių gripą su XX a. pradžios "Ispanijos gripu"). Tačiau šios metodikos turi įtraukti duomenys apie galimą populiacijos dydį bei praėjusių kartų kiekį, kad nusakyti kokia tikimybė kad būtent tas individas yra šiuolaikinių individų protėvis ir ar galima naudoti jo duomenys kaip protėvio (pvz. mumijos atveju būtu labai maža tikimybė, kad ji yra kažkieno iš šiuolaikinių žmonių protėvis). Plačiau apžvalgos skyrelyje - maišymosį medžiai.
Kiti metodai filogenetinių medžių paieškoje:Hadamaro metodas. Jo pagalba galima nustatyti, koks yra narinėjamų rūšių pozicijų palaikymas medyje.
Bajesiniai metodai (
Bayesian inference), kurie yra paremti santykinės įvykio tikimybės radimo teorema, suformuluota viduramžių vienuolio Tomo Bajeso. Naudojami netieioginiai metodai parametrų radimui, tarp jų Markovo grandinių Monte Karlo metodika (
MCMC). Paskutinį metodą naudoja, pvz. parazito-šeimininko rūšiadaros eiliškumui nustatyti; kaip kinta evoliucijos greičiai filogenetiniame medyje; filogenetinio medžio atitikimo duomenų bei evoliucinių modelių adekvatumo nustatymui.
Taip pat egzistuoja metodai kurie yra paremti kiekybinių požymių pasiskirstimais, kaip pvz. genų dažniais populiacijose. Šiuose metoduose lyginamas populiacijų panašumas, priimant kad genai (arba aleliai) plinta populiacijoje pagal brauno judėjimo modelį (angl.
brownian motion ). Populiacijų lyginimas pagal genų dažnius vykdomas naudojantys pataisyto didžiausio tikėtinumo metodais (nes klasikinis didžiausio tikėtinumo metodas šioje situacijoje, dėl savo matematinės išraiškos pobūdžio duoda artefaktinius rezultatus), pvz. REML (angl.
Restricted Maximum Likelihood), kuris atmeta populiacijų padėtį fenotipinėje erdvėje ir tiktai nusako atstumus tarp jų, jis buvo įvestas Dž. Felzenštaino.
Kiti
kiekybiniai požymiai - tai
morfologinis fenotipas, matuojamas kontiniumo skalėje. Kiekybinėje genetikoje priimama kad morfologiniai požymiai yra "tolygus" ir poligenetiniai. T. y. priimama kad kiekvieną požymį nulemia daugelis genų nepriklausomai vieni nuo kitų bei nuo aplinkos sąlygų. Taip lyginant požymių pokyčius nustatoma natūraliosios atrankos kryptis. Ši teorija savo šaknimis remiasi į jau minėto statistiko ir evoliucinio biologo R. Fišerio (
Ronald Fisher) darbus (1918 metais). Ši teorija gerai veikia tiktai trumpais laiko masteliais. Evoliucijai trunkant ilgam laikui ir nevykstant natūraliai atrankai kintamumas priklauso tiktai nuo mutacijų kiekio ir nepriklausomas nuo populiacijos dydžio. Veikiant natūraliai atrankai, evoliucija modeliuojama kaip Brauno judėjimas sekantis paskui fenotipinį optimumą (
Ornstein-Uhlenbech (OU) procesas). Pertrauktos pusiausvyros rūšiadaros proceso metu, didžioji dalis požymių pokyčių yra sukoncentruota ties trumpais intervalais, todėl šis procesas modeliuojamas kitaip, kaip - gimimo-mirties procesas (angl.
Birth-death process), kuris panašėja į brauno judėjima tiktai stambiuose laiko masteliuose. Atliekant kladistinę analizę, stengiamasi kad šie kiekybiniai požymiai būtu diskretizuoti. Tam yra keletas metodų:
spragų kodavimas,
generalizuotas spragų kodavimas ir
segmentų kodavimas. Spragų kodavimas vyksta tuomet kai kiekybinėje skalėje yra natūralios spragos tarp rūšių (neegzistuoja individų su tarpinėmis požymio charakteristikomis), ties spragomis nustatant kiekybines ribas tarp rūšių, koduojant tuos intervalus sveikais skaičiais. Generalizuotas spragų kodavimas yra labai panašus į spragų kodavimą, tik pačiose spragose išskiriami papildomi "nematomi" požymiai, kurie taip pat yra koduojami pagal eiliškumą. Segmentinis kodavimas - sudalina rūšių eilės vidurkius į kuo daugiau būsenų, vėliau įstatant rūšis į gautas būsenas.
Maišymosį medžiai (angl. Coalescent trees): Maišymosi medžių metodikos dažniausiai yra naudojamos analizuojant genetinį kintamumą bei populiacijų istorijas rūšies viduje arba tarp artimų rūšių. Nes pačiose populiacijose skirtingi individai turi skirtingus medžius (aišku jeigu juos lyginti su kitomis rūšimis, tai tos pačios rūšies skirtingi individai turėtu nekeisti bendros topologijos). Kaip pasirodo, netgi atskiri genai gali turėti atskirus medžius, kurių topologija gali skirtis nuo artimų rūšių filogenijos topologijos (kodėl taip yra paaiškės šiek tiek vėliau). Tam tikro geno perėjimo į sekančią kartą tikimybę formalizavo 1982 metais, tikimybių teorijos specialistas J.F.C. Kingman. Tikimybė, kad tam tikro individo, tam tikras genas pereis į sekančią kartą yra lygus 1/(2N) (kur N - populiacijos dydis), ir taip einant iš kartos į kartą (panašiai kaip metant moneta kad pastoviai iškristu herbas). O laikas reikalingas tam kad visos linijos populiacijoje susimaišytu yra lygus =4N(1-(1/K)), kur K - genų kopijų kiekis. Kaip lygina J. Felsenstein, procesas yra panašus į piktų "vabalų dežės" modelį, kai agresyvus vabzdžiai susidurdami pradeda kovoti ir vienas iš jų žūsta, kol galu gale belieka tiktai vienas vabalas. Todėl po kurio laiko populiacijoje dėl atsitiktinio maišymosi galų gale visi nariai turi atsitiktinio genų dreifo išvengusį lokusą. Todėl, kaip pažymi Felsenstein, kiekvienas lokusas turi savo protėvinį individą, kaip mitochondrijos turi savo "Ievą" ir "Y-chromosoma" turi savo Adoma (kurie beje niekad nebuvo susitikę, nes buvo atskirti dešimtimis tūkstančių metų), kaip ir hemoglobino Semą arba citochromo Friedą :-) Svarbus parametrai maišymosi vertinime yra efektyvus populiacijos dydis, galima geografinė rūšies struktūra, kurios pasekmė yra migracijos procesas. Taip pat yra svarbus rekombinacijos efektas (proporcingas 4*N*r, kur "r" - rekombinuotų genų dalis genome). Vienas didžiausių sunkumų maišymosi proceso vertinime yra natūraliosios atrankos veikimas. Maišymosi medžių paieškoje, dažniausiai yra naudojami didžiausio tikėtinumo metodai.
Kai kada, kaip jau minėta, genų genealogijos neatitinka rūšių filogenetinių medžių. Tai įvyksta tuo metu, kai populiacijos yra didelės ir maišymasis nespėja įvykti po to kai genas jau atsirado kai kurioje populiacijos dalyje. Pvz. yra apskaičiuota, jeigu filogenijoje yra 3 rūšys, tuomet neteisingos filogenijos tikimybė yra lygi =(2/3)*e^(-t/2Ne) (geras pavizdys iš Felsenstein, 2004 -
pav6). Vienas iš būdu sumažinti šį efektą - reikia naudoti keletą lokusų.
Kalbant apie populiacinius genetinius procesus
, svarbu paminėti
genomines pertvarkas, insercijų, delecijų bei duplikacijų paieškas. Sudarinėjant filogenetinius medžius, naudojant parsimonijos metodiką įmanoma nustatyti kiek kada ir kokiose filogenetinio medžio atšakose įvyko šie genomo lygio įvykiai. Egzituoja įvairus tikimybiniai algoritmai: Bišopo ir Tompsono metodas, minimalios žinutės ilgio ir kt. Genų šeimos surandamos lyginant rūšių ir genų medžius, egzistuoja ir duplikacijų paieškos algoritmai. Ieškant duplikacijų kiekį naudojami tiktai įšakninti medžiai ( nes reikia žinoti kokia kryptimi vyko genų evoliucija). (
G-moksluose -
genų duplikacijos tyrimas Kreidos periodo išmirimo tyrimuose).
Lyginamasis metodas:
Organizmų lyginimas yra biologijos pagrindas. Tačiau tai
atliekant be organizmų filogenezės žinių gali vesti į neteisingus
rezultatus. Pagal Felzenštainą, : "Filogenetinių medžių esmė yra ta,
kad parodyti kad evoliucija neveikė kiekvieną rūšį atskirai, o jos yra
susietos istoriniais įvykiais, kurie paveikia dideles rūšių grupes".
Lyginamųjų metodų (pvz. kontrastų metodas, generalizuoti mažiausieji
kvadratai, filogenetinės autokoreliacijos) naudojimo pasitelkiant
filogenezes esmė yra ta, kad nustatyti kaip požymiai filogenezėje
koreliuojasi evoliucijoje tarpusavyje, tam kad galima būtu nustatyti jų
evoliucinius santykius.
Evoliucijos modelių ir medžių patikimumo tikrinimas:
Dažnai skirtingų modelių, vienodai gerai aprašančių duomenys
palyginimui naudojamas vienas iš dviejų daugiamodelinio palyginimo
kriterijų. vienas iš jų vadinasi
AIC (Akaike Informacinis Kriterijus) kitas
BIC
(Bajesinis Informacinis Kriterijus). Abu kriterijai naudoja tikėtinumo
santykius. AIC atveju surandamos log-tikėtinumo reikšmės, kurios pačios
didžiausios būna esant geriausiam atitikimui. Esant modelyje p -
parametrų, tikėtinumo įvertis mažėja proporcingai "p". Tai yra
privilegijuojami mažiau parametrų turintys modeliai. Todėl tarkim,
kartais neteisingai gali privilegijuoti "paprastesnius"
multifurkuojačius medžiu vietoj bifurkuojančių, nes turima mažiau
atsišakojimo žingsnių (tačiau iš kitos pusės mažėja susiderinimas su
duomenimis).
Butstrapas,
džeknajfas bei
permutacijos
testai - neparametrinės statistinės procedūros reikalingos tam kad nustatyti
požymiuose tarp taksonų esantį kintamumą, vykstant evoliucijos
procesui. Kita šių metodų naudojimo priežastis yra ta kad norima
nustatyti parametrų kintamumą modeliuose, kurie yra per daug sudėtingi,
tam kad įmanoma būtu apskaičiuoti jų variabilumą (kintamumą). Butstrapingas remiasi tuo, kad vykdomas resamplingas (pakartotinas
pavyzdžių paėmimas) iš imties, su vėlesniu imties pakeitimu į
sintetinę, ir taip kartojant kol imties pasiskirstymas stabilizuojasi
ir galima nustatyti jos formą. Vykdant filogenezių butstrapingo
procedūrą, rūšys negali būti nagrinėjamos kaip nepriklausomos (nes
filogenija sudaro tokią priklausomybę). Tuo tarpu požymiai, kuriais
pasižymi rūšys nėra stipriai koreliuoti ir jų evoliucija yra
nepriklausoma, todėl ši procedūra dažniausiais pritaikoma būtent jiems.
"Delete-half-jacknife" procedūra pagal savo randamų statistinių įverčių
pobūdi yra labai panaši į butstrapingą, tačiau nuo jo skiriasi tuo kad
pusė imties yra pašalinama o ne paimama.
Vykdant filogenetinę analizę dažnai nurodoma, kad šakų išsiskirimo
mazguose (bifurkacijos taškuose) yra nurodomi butstrapo įverčiai
procentais, kurie turi parodyti šios grupės neparametrinį statistinį
tikėtinumą. Tačiau, kaip yra pastebėta, šie butstrapo įverčiai dažnai
būna užžeminti (ir sakoma kad jeigu tikimybė yra ~70%, tai ji yra
pakankamai gera). Nustatyta kad šiuo atžvilgiu butstrapo patikimumas
stipriai priklauso nuo požymių kiekio, o teisingiau pasakius nuo
požymių kiekio "n" ir dispersijos "S^2"sandaugos. Kai pvz. ši sandauga
lygi 0,1, tuomet buststrapas rodo užaukštintus rezultatus; jeigu
sandauga lygi 1, tuomet butstrapas rodo teisingas reikšmes, o jeigu ši
sandauga lygi 2 , tuomet butstrapas rodo užžemintas reikšmes (ir 70%
patikimumas realiai atitiktu 95% patikimumą) (šias priklausomybes gerai
parodo grafikas -
pav5 iš Felsenstein, 2004).
Konsensuso medžiai - tai medžiai, kurie sudaromi tuomet kai filogenetinės analizės metu surandami keli ekvivalentiški medžiai, norint suprasti kurios tuose medžiuose esančios grupės yra stabilesnės.
Strict consensus - metodas yra paprasčiausias ir sukuria medžius, kuriuose yra visos grupės aptinkamos visuose medžiuose. Pagal
majority-rule consensus metodą, surandamos grupės, kurios dažniausiai pasitaiko tarp surastų medžių.
Adamso konsensuso metodo esmė yra ta, kad surasti visus 3 taksonų tvirtinimus (du taksonai visados yra artimesni nei trečias), vėliau atvaizduojant tuos medžius kurie turi visus bendrus 3 taksonų tvirtinimus. Konsensuso medžiai naudojant šakų ilgius - paimami šakų ilgių vidurkiai arba medianos, o jeigu tam tikrų atšakų nėra, tai joms priskiriami "0". ( Konsensuso medžio pavyzdys, surastas naudojant PAST programą -
pav7. Matosi kad dauguma kladų kolapsavo į polifurkacinį mazgą kairėje, tai įvyksta tuo metu kai naudojami prieštaringi duomenys. Šiuo atveju buvo naudota "0" ir "1" atsitiktinai sugeneruotų požymių matrica).
Alternatyvus priėjimas konsensuso medžiams yra
totalių įrodymų analizė. Vietoj to kad surasti kažkokią bendrą medį, derinant skirtingus medžius surastus pagal skirtingus lokusus, vienu metu nagrinėjami įrodymai iš daugelio lokusų, o taip pat atsižvelgiama į morfologiją bei fosilijas (galimi protėviai bei informacija apie laikinius požymių atsiradimo santykius).
Filogenetiniai medžių formos tyrimų vaidmuo makroevoliucijos tyrimuose:
Kaip rašo Felzenštainas: "Didėjant rūšių kiekiui, kurios buvo ištirtos filogenetiškai, vis didėja susidomėjimas panaudoti šių medžių formą evoliuciniuose klausimuose". Šie klausimai yra sekantis: kaip "raktinės inovacijos" pakeičia kladų išlikimo ir diversifikacijos tikimybes, kaip atsiradimo ir išmirimo greičiai varijuoja laiko atžvilgiu, kaip atsiradimo ir išmirimo greičiai priklauso nuo tam tikrų fenotipų? Į šiuos ir daugelį kitų makroevoliucinių klausimų padeda atsakyti gerai išspręsto filogenijos, nes jos padeda nustatyti atskirų kladų istorijas. Ar jos iš tikrųjų išmirė ar įvyko pseudoišmirimas, pvz. devono periodo riešapelekės - panderichtidai iš tikrųjų neišmirė - mes esame jų atšaka. Taip pat dėka filogenetinės analizės, mes dabar žinome kad viena dinozaurų klada vadinama
Aves išgyveno iki šių dienų ir išvengė savo giminaičių lemties. Taip pat nesigylinanat į detales, filogenetiniai medžiai padeda nustatyti ar makroevoliucija turi kažkokį trendą ir ji labiau panašėja į stochastinį rūšiadaros kitimą kai pastoviai didėja įvairovė ar ji yra varoma kažkokios jėgos (suvaržymų arba natūraliosios atrankos) tam tikra kryptimi (t.y. ar realiai egzistuoja progresas?).
Pabaigai: Šiuos ir daugelį kitų nepaminėtų šioje apžvalgoje klausimų Jus galite atsakyti, atliekant filogenetinę analizę. Kas susidomėsite, šią apžvalga galite naudoti kaip startinį tašką gylinantis į šią fundamentinę evoliucinės biologijos atšaką. Sekmės! :-)
Nuorodos:Joseph Felsenstein, Inferring Phylogenies, Sinauer Associates, Massachsetts, 2004, 664 p. -
Pats pilniausias iki šiol išėjęs filogenetinės teorijos traktatas, kurį parašė Joseph Felsenstein - veikiausiai aktyviausias mokslininkas šioje srityje, prisidėjęs prie daugelio originalių teorinių problemų sprendimo. (Ačiū Violeta už įskaitmeninimą :-)
Joseph Felsenstein.
Theoretical evolutionary genetics. 2007 - Knyga, kurioje Joseph Felsenstein, pateikia jo skaitomo kurso "teorinė evoliucinė genetika" medžiaga, apibendrinta kaip kol kas neišspausdinta knyga.
Øyvind Hammer and David A.T. Harper Paleontological Data Analysis. Wiley-Blackwell (November 10, 2005), 368 p -
Knyga skirta paleontologinių duomenų analizės metodų apžvalgai, su metodų panaudojimo pavyzdžiais. Bei autorių sukurta statistinė programa su aprašymais - PAST.
Jeffrey S. Levinton ,Genetics, Paleontology and Macroevolution,Cambridge University Press; 2 edition (August 6, 2001), 634 p -
Džefrio Levintono knyga skirta evoliucijos teorijos apžvalgai.
Alec L. Panchen, Classification, Evolution, and the Nature of Biology.Cambridge University Press (June 26, 1992) -
Knyga apie klasifikacijos prigimtį ir svarbą biologijai.
Hanno Sandvik, Tree thinking cannot taken for granted: challenges for teaching phylogenetics. Theory in Biosciences, Volume 127, Number 1 / March, 2008 -
Straipsnis "Theory in Biosciences" žurnale apie "mastymą medžiais"
Filogenetinių programų sąrašas:Joe Felsenstein's list of phylogeny programs -
veikiausiai pats pilniausias filogenetinių programų sąrašas internete, be to suklasifikuota pagal įvairiausias kategorijas (nuo prieinamumo tipo iki to kokius duomenų tipus analizuoja programos).
--
AS