Abstract

Secvențierea recentă de mare capacitate a transcriptomilor creierului și ficatului cimpanzeului publicată în Biologia genomului dezvăluie mai multe transcrieri pierdute în genomul uman și evidențiază incompletitudinea adnotărilor genomului primatului.

caracteristicilor

Evidențierea cercetării

Finalizarea genomului uman a fost urmată de secvențierea genomului speciilor de primate strâns legate, cum ar fi cimpanzeul și macacul resus. Motivația a fost simplă: deoarece genomul a furnizat planul unui organism, comparațiile dintre genomul uman și genomul primatelor neumane ar trebui să dezvăluie trăsăturile genomice care stau la baza fenotipului uman.

O problemă cu această abordare, totuși, este că un genom nu este într-adevăr un plan al unui fenotip, ci mai degrabă un mesaj bine amestecat, în care secvențe relevante din punct de vedere funcțional se pierd într-o mare de informații fenotipice neutre. O modalitate aparent simplă de identificare a secvențelor funcționale este determinarea regiunilor transcrise. Aceasta nu este o sarcină simplă, totuși, deoarece transcriptomul variază foarte mult în funcție de tipurile de celule și se schimbă dramatic de-a lungul duratei de viață a unui organism. Astfel, în ultimul deceniu, s-a depus un efort mare în adnotarea transcriptomului uman, în principal prin secvențierea transcrierilor convertite în biblioteci de ADNc prin secvențierea convențională Sanger. Ca rezultat, a devenit clar că, având în vedere acoperirea suficientă a secvențierii, aproape orice secvență genomică poate fi detectată la nivelul transcriptomului [1]. Acest lucru nu este deloc surprinzător, deoarece genele umane conțin frecvent introni lungi; în plus, ARN polimeraza poate genera transcripții spontane fără relevanță funcțională. Totuși, acest rezultat a indicat că împărțirea genomului în părți transcrise și non-transcrise pentru a determina funcționalitatea a fost în mare parte inutilă.

Aceste proiecte de secvențiere ADNc au arătat, de asemenea, că limitele majorității genelor umane, inclusiv site-urile de pornire și terminare a transcripției și modelele de îmbinare a exonilor interni, sunt destul de neclare [2-6]. În plus, multe dintre transcrierile identificate și izoformele genetice s-au dovedit a fi rare. Acest lucru nu înseamnă, totuși, că acestea sunt irelevante din punct de vedere funcțional, deoarece astfel de transcrieri pot avea roluri importante într-un număr limitat de celule dintr-un țesut sau într-un stadiu specific de dezvoltare. Mai mult, mulți regulatori importanți, cum ar fi factorii de transcripție, sunt exprimați la niveluri scăzute. Ca urmare, adnotarea transcriptomului uman actual reprezintă un anumit compromis între încredere și cuprinzătoare și conține transcrieri identificate cu diferite grade de încredere. Dificultatea în compilarea unei astfel de adnotări este ilustrată cel mai bine de diferențele care există între RefSeq, Ensembl, Universitatea din California Santa Cruz (UCSC) Genome Browser, Vega Genome Browser și o bază de date integrată de gene și transcrieri umane (H-Invitational Database ): se constată o suprapunere medie de 60 până la 70% comparând oricare dintre aceste două baze de date de adnotări.

O altă modalitate de a determina transcrierile relevante funcțional este de a cere ca expresia unei transcrieri date să fie conservată între specii. Alternativ, dacă cineva este interesat de loci importanți pentru fenotipul uman, s-ar putea identifica regiuni cu profiluri de transcripție specifice omului. Cu toate acestea, adnotarea transcriptomului primatelor neumane este practic inexistentă și ceea ce este prezent se bazează în totalitate pe cartarea adnotării umane la genomii primatelor respective. Deoarece adnotarea transcriptomului uman în sine este departe de a fi cuprinzătoare, iar calitatea genomului primatului neuman este mult mai proastă decât calitatea genomului uman, o astfel de adnotare bazată pe cartografiere nu este lipsită de probleme. Dar, cel mai important, chiar dacă această metodă ar putea permite identificarea transcrierilor prezente la om și absente la alte primate, nu permite identificarea transcrierilor pierdute din descendența umană.

Aceste descoperiri [7] adaugă greutate la ipoteza evoluției umane „mai puțin este mai mult”, postulând că unele dintre caracteristicile specifice omului au evoluat nu prin achiziționarea de elemente genetice noi, ci prin pierderea funcțională a celor existente anterior. Acest studiu realizat de Cavelier și colegii [7] arată în mod clar că pierderea specifică omului a regiunilor transcrise nu se limitează la gene adnotate care codifică proteinele, ci este frecventă printre transcrierile intergenice și ARN necodificate. Această constatare este în acord cu studiile anterioare ale transcriptomilor cerebrali umani și cimpanzei efectuate folosind tablouri de plăci [8], secvențierea de mare viteză a etichetelor exprimate [9] și secvențierea de mare viteză a transcriptomilor complet [10], pe care toți indică faptul că o proporție mare a câștigului și pierderii transcripției specifice omului provine din regiuni genomice încă neanotate. Astfel, sarcina actuală este de a dezvălui proprietățile funcționale ale acestor transcrieri noi, dacă acestea există.

Foarte important, studiul [7] atrage atenția asupra stării precare a adnotării genomului la primatele neumane. La om, utilizarea tehnologiei de secvențiere de mare viteză în studiile transcriptomului a relevat deja o variabilitate mult mai mare a izoformelor transcriptului genei decât s-a apreciat anterior [2, 3]. La primatele neumane, precum cimpanzeii și macacii rhesus, atât informațiile cunoscute despre secvența genomului, cât și, în special, adnotările genomului se află într-o stare mult mai proastă decât cele ale oamenilor. Studiul lui Cavelier și al colegilor [7] ilustrează clar că caracterizarea atentă a transcriptomilor primatelor umane și neumane poate descoperi un număr mare de modificări genetice și transcripționale specifice oamenilor. Unele dintre aceste schimbări vor fi responsabile pentru evoluția caracteristicilor specifice omului, cum ar fi adaptarea la o dietă gătită, foarte hrănitoare și abilități sociale și cognitive unice. Găsirea elementelor genetice care stau la baza acestor trăsături umane unice este importantă nu numai pentru înțelegerea evoluției umane, ci și pentru prevenirea disfuncționalităților lor care pot duce la tulburări metabolice și cognitive.

Progresele recente în metodologia de secvențiere cu randament ridicat ne oferă instrumente puternice cu care să caracterizăm transcriptomii complet în mai multe țesuturi și tipuri de celule din speciile de primate, rezultând identificarea cuprinzătoare a caracteristicilor transcriptomului specifice oamenilor. Lucrarea lui Cavelier și a colegilor [7] este primul pas curajos în această direcție.

Referințe

ENCODE Project Consortium, Birney E, Stamatoyannopoulos JA, Dutta A, Guigó R, Gingeras TR, Margulies EH, Weng Z, Snyder M, Dermitzakis ET, Thurman RE, Kuehn MS, Taylor CM, Neph S, Koch CM, Asthana S, Malhotra A, Adzhubei I, Greenbaum JA, Andrews RM, Flicek P, Boyle PJ, Cao H, Carter NP, Clelland GK, Davis S, Day N, Dhami P, Dillon SC, Dorschner MO, și colab.: Identificarea și analiza elementelor funcționale la 1% din genomul uman prin proiectul pilot ENCODE. Natură. 2007, 447: 799-816. 10.1038/nature05874.

Wang ET, Sandberg R, Luo S, Khrebtukova I, Zhang L, Mayr C, Kingsmore SF, Schroth GP, Burge CB: Reglarea alternativă a izoformei în transcriptomii țesutului uman. Natură. 2008, 456: 470-476. 10.1038/nature07509.

Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, Seifert M, Borodina T, Soldatov A, Parkhomchuk D, Schmidt D, O'Keeffe S, Haas S, Vingron M, Lehrach H, Yaspo ML: O viziune globală a activității genelor și a îmbinării alternative prin secvențierea profundă a transcriptomului uman. Ştiinţă. 2008, 321: 956-960. 10.1126/science.1160342.

Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L. Nat Biotechnol. 2010, 28: 511-515. 10.1038/nbt.1621.

Tian B, Pan Z, Lee JY: Evenimentele de poliadenilare a ARNm răspândite în introni indică o interacțiune dinamică între poliadenilare și îmbinare. Genom Res. 2007, 17: 156-165. 10.1101/gr.5532707.

Carninci P, Sandelin A, Lenhard B, Katayama S, Shimokawa K, Ponjavic J, Semple CA, Taylor MS, Engstrom PG, Frith MC, Forrest AR, Alkema WB, Tan SL, Plessy C, Kodzius R, Ravasi T, Kasukawa T, Fukuda S, Kanamori-Katayama M, Kitazume Y, Kawaji H, Kai C, Nakamura M, Konno H, Nakano K, Mottagui-Tabar S, Arner P, Chesi A, Gustincich S, Persichetti F și colab.: Genome-wide analiza arhitecturii și evoluției promotorului de mamifere. Nat Genet. 2006, 38: 626-635. 10.1038/ng1789.

Wetterbom A, Ameur A, Feuk L, Gyllensten U, Cavelier L: Identificarea exonilor noi și a regiunilor transcrise prin secvențierea transcriptomului cimpanzeului. Genomul Biol. 2010, 11: R78-10.1186/gb-2010-11-7-r78.

Khaitovich P, Kelso J, Franz H, Visagie J, Giger T, Joerchel S, Petzold E, Green RE, Lachmann M, Paabo S: Funcționalitatea transcripției intergenice: o comparație evolutivă. PLoS Genet. 2006, 2: e171-10.1371/journal.pgen.0020171.

Babbitt CC, Fedrigo O, Pfefferle AD, Boyle AP, Horvath JE, Furey TS, Wray GA: Atât ARN-urile necodificate, cât și cele care codifică proteinele contribuie la evoluția expresiei genelor în creierul primatului. Genomul Biol Evol. 2010, 2010: 67-79. 10.1093/gbe/evq002.