Subiecte

Abstract

Introducere

Tulburarea bipolară (BD) este o boală psihiatrică cronică și invalidantă, cu o prevalență de 0,8-1,2% în populația generală 1, caracterizată prin episoade maniacale și depresive recurente. Fiind caracterizat de rate ridicate de comorbiditate fizică și risc crescut de sinucidere, BD este asociată cu scăderea speranței de viață și creșterea mortalității prin toate cauzele și, prin urmare, este o povară socio-economică majoră 2 .

În studiul de față, am profitat de seturile de date GWAS disponibile public pentru a efectua analize bazate pe gene, precum și meta-analize încrucișate care vizează (1) identificarea genelor asociate în mod obișnuit cu BD și IMC sau BD și T2D și (2) ) investigarea dacă genele împărțite între aceste condiții sunt îmbogățite pentru căile implicate anterior în fiziopatologia BD sau în mecanismul de acțiune al medicamentelor utilizate pentru tratarea BD.

Material si metode

Probă

Prezentul studiu a fost realizat pe baza statisticilor sumare a trei mari seturi de date publice GWAS. Statisticile sumare includ toate SNP-urile care au fost analizate, împreună cu dimensiunile efectului calculate. Evaluarea genelor asociate BD a fost efectuată utilizând statistici de sinteză din cel mai mare GWAS realizat de Grupul de lucru pentru tulburarea bipolară a consorțiului psihiatric de genomică (PGC) până în prezent 37. Setul de date a inclus rezultate GWAS din analize de regresie logistică pe peste 13,4 milioane de SNP-uri autozomale pe 20.352 cazuri BD conform criteriilor DSM-IV, ICD-9 sau ICD-10 și 31.358 controale de descendență europeană. Caracteristicile detaliate ale fiecărei cohorte incluse au fost descrise în lucrarea lui Stahl și colegii săi 37. Mai mult, pentru a identifica genele asociate cu T2D, am folosit setul de date Etapa 1 meta-analiză DIAGRAM 1000G GWAS, incluzând 26.676 de cazuri T2D și 132.532 controale caucaziene din 18 studii 38. Criteriile pentru diagnosticul T2D au diferit între studii și au inclus diagnosticul auto-raportat al diabetului de către un medic, utilizarea auto-raportată a medicamentelor pentru tratarea diabetului, glucoza de post ≥ 7,0 mmol/l sau glucoza non-post ≥ 11,1 mmol/l, hemoglobina A1c (HbA1c)> = 6,5% 38. Acest set de date a raportat statistici rezumative ale asociației pentru peste 12,06 milioane de SNP-uri autozomale.

În cele din urmă, genele asociate cu IMC au fost investigate folosind setul de date meta-analiză GWAS plus Metabochip din GIANT Consortium 39. Acest set de date a inclus statistici de asociere sumară a 322.154 subiecți de origine europeană. Participanții au fost recrutați din 125 de studii (82 cu GWAS și 43 cu rezultate Metabochip). În acest set de date, peste 2,47 milioane de variante autotipice genotipate sau imputate au fost testate pentru asocierea cu reziduuri BMI transformate în regresii liniare, presupunând un model genetic aditiv 39 .

Analiza bazată pe gene

Pentru fiecare dintre cele trei seturi de date, a fost efectuată o analiză bazată pe gene cu MAGMA 40, utilizând platforma FUMA 41. MAGMA este un instrument pentru analiza genelor care estimează statisticile bazate pe gene, luând în considerare dezechilibrul de legătură (LD) al SNP-urilor incluse. LD a fost estimat folosind panoul european al datelor de fază 3 1000 genomi ca referință 42. Locațiile genelor care codifică proteinele au fost definite ca regiunile de la locul de pornire a transcrierii la locul de oprire a transcripției (opțiune implicită în MAGMA). În cazul în care un set de date a raportat informații despre calitatea imputării sau frecvența alelei minore (MAF), SNP-urile cu scorul calității imputării 43 folosind funcția p.adjust în R 44. Testul hipergeometric a fost utilizat pentru a evalua supra-reprezentarea genelor semnificativ asociate cu BD și IMC sau T2D după corecția testării multiple. Analizele au fost efectuate folosind R v. 3.6.1 (ref. 44).

Analiza căii

Îmbogățirea pentru termenii non-redundanți ai Ontologiei genetice (GO) și căile Reactome printre genele asociate în mod obișnuit cu BD și IMC, BD și T2D sau toate cele trei fenotipuri a fost evaluată folosind instrumentul de analiză funcțională de îmbogățire funcțională WebGestalt (www.webgestalt.org/). Pentru a include cel mai mare număr de gene potențial relevante în analiza căii, am folosit lista genelor asociate nominal cu trăsăturile intereselor, cu o p 45. Pentru această analiză, scorul de interacțiune a fost stabilit la o încredere ridicată (scor = 0,7) și au fost incluse toate sursele de interacțiune active susținute de instrument (extragerea textului, experimente, baze de date, coexpresie, vecinătate, fuziune genică și co-apariție).

Metaanaliza și efectele funcționale ale SNP-urilor asociate cu BD și IMC sau T2D

Pentru a identifica SNP-uri specifice asociate cu BD și IMC sau T2D, am realizat două meta-analize între BD și IMC, precum și BD și T2D folosind Metasoft 46. Acest software oferă estimări ale efectului, estimări ale eterogenității, precum și o probabilitate posterioară ca un efect să existe în fiecare studiu (m-statistici valorice> 0,9). Cele două meta-analize au fost realizate cu un model conservator cu efect aleatoriu utilizând aceeași listă de SNP-uri ale analizei bazate pe gene ca input. Pentru ambele meta-analize, am selectat SNP-uri cu o meta-analiză p 0,9 și a p 47. Dintre SNP-urile prezise de RegulomeDB care afectează probabil legarea factorilor de transcripție (scor 48. În cele din urmă, prezența SNP-urilor localizate în gene potențial drogabile a fost investigată folosind baza de date de interacțiune cu genele medicamentoase (DGIdb) 49 .

Rezultate

Analiza bazată pe gene

O diagramă a analizelor este raportată în Fig. Suplimentară. 1. Un total de 2.013.566 SNP-uri care au trecut controlul calității și au fost prezente în toate seturile de date au fost utilizate ca input pentru analiza bazată pe gene. Aceste SNP-uri au permis efectuarea unei analize bazate pe gene pentru 17.455 de gene. Analizele genetice efectuate cu MAGMA au identificat 2700, 2144 și 1988 gene asociate nominal cu BD, IMC și respectiv T2D. Dintre acestea, un total de 579, 549 și 173 au fost semnificative după corecția testelor multiple cu BH, respectiv.

La compararea celor trei liste, s-a constatat că 518 gene sunt asociate în mod obișnuit cu BD și IMC, dintre care 52 au fost semnificative după corecția testării multiple (Tabelul 1 suplimentar). Numărul de gene asociate cu ambele fenotipuri a fost de 2,86 ori mai mare decât se aștepta pe baza rezultatelor testului hipergeometric (p = 9.4E - 12, Tabelul suplimentar 2). În ceea ce privește BD și T2D, 390 de gene au fost asociate cu ambele fenotipuri, dintre care 12 au fost semnificative după corecția testării multiple (Tabelul suplimentar 3). Numărul de gene suprapuse a fost de 2,09 ori mai mare decât se aștepta pe baza rezultatelor testului hipergeometric (p = 0,01, tabelul suplimentar 2). În mod similar, genele asociate cu BD au fost îmbogățite pentru țintele asociate fie cu IMC, fie cu T2D (p = 2.6E - 12, tabelul suplimentar 2). În cele din urmă, 93 de gene, dintre care trei au fost semnificative după corecția testării multiple, au fost asociate cu toate fenotipurile investigate (Tabelul suplimentar 4). Genele asociate cu BD nu au fost îmbogățite semnificativ pentru țintele asociate atât cu IMC, cât și cu T2D (p = 0,076, Tabelul suplimentar 2).

Analize ale căilor

Analizele efectuate utilizând WebGestalt au arătat că genele asociate în mod obișnuit cu BD și IMC au fost îmbogățite pentru un termen GO cu componentă celulară: corpul celular neuronal (p = 0,0001; rata de descoperire falsă (FDR) = 0,025) (Tabelul 2). În plus, genele asociate în mod obișnuit cu BD și IMC au fost îmbogățite pentru 12 căi (Tabelul suplimentar 5). Metoda de acoperire a setului ponderat implementată de WebGestalt, care reduce redundanța seturilor de gene, a confirmat o asociere semnificativă pentru patru dintre aceste căi: hemostază, semnalizare prin arici, interacțiuni L1CAM și semnalizare prin fuziuni BRAF și RAF (Tabelul 2), precum și pentru termenul GO. Am explorat în continuare interacțiunile potențiale dintre proteinele codificate de cele 518 gene asociate în mod obișnuit cu BD și IMC folosind STRING. Această analiză a arătat că rețeaua de proteine ​​codificate de aceste gene a prezentat un număr de interacțiuni mai mare decât se aștepta pentru un set aleatoriu de proteine ​​de dimensiuni similare extrase din genom (numărul așteptat de margini: 332; numărul de margini observat: 392; Îmbogățirea PPI p = 0,0007, Fig. 1), susținând ipoteza că proteinele codificate de gene asociate în mod obișnuit cu BD și IMC ar putea fi legate biologic.

genele

Rezultatul analizei interacțiunii proteină - proteină efectuată utilizând STRING cu gene asociate cu tulburarea bipolară și IMC ca input. Fiecare nod reprezintă toate proteinele produse de un singur loc genic care codifică proteina (izoformele de îmbinare sunt prăbușite), în timp ce marginile reprezintă asociații proteină-proteină. Scorul de interacțiune a fost stabilit la o încredere ridicată (scor = 0,7) și au fost incluse toate sursele de interacțiune active susținute de instrument (extragerea textului, experimente, baze de date, coexpresie, vecinătate, fuziune genică și co-apariție). Rețeaua de proteine ​​codificate de gene asociate în mod obișnuit cu tulburarea bipolară și IMC prezintă mai multe interacțiuni comparativ cu numărul așteptat pentru un set aleatoriu de proteine ​​de dimensiuni similare extrase din genom (număr de noduri: 504, număr așteptat de margini: 332, observat număr de margini: 392, îmbogățirea interacțiunii proteină - proteină p = 0,0007).

Nu a fost observată nicio categorie îmbogățită semnificativ de termeni sau căi GO pentru genele asociate în mod obișnuit cu BD și T2D. Cu toate acestea, rețeaua de proteine ​​codificate de aceste gene a prezentat mai multe interacțiuni decât s-ar fi așteptat pentru un set aleatoriu de proteine ​​de dimensiuni similare extrase din genom (numărul așteptat de margini: 163; numărul de margini observat: 215; Îmbogățirea PPI p = 5.8E - 05, Fig. Suplimentar 2).

Genele asociate cu BD, IMC și T2D nu s-au dovedit a fi îmbogățite semnificativ pentru termeni sau căi GO specifice. Mai mult, rețeaua de proteine ​​codificate de aceste gene nu a prezentat un număr semnificativ mai mare de interacțiuni decât s-ar fi așteptat pentru un set aleatoriu de proteine ​​de dimensiuni similare extrase din genom (numărul așteptat de margini: 10; numărul observat de margini: 10; Îmbogățirea PPI p = 0,58).

Metaanaliza și efectele funcționale ale SNP-urilor asociate cu BD și IMC sau T2D

Meta-analizele cu Metasoft au fost realizate pe 2.013.566 SNP-uri pentru care datele erau disponibile în toate cele trei seturi de date, care au fost, de asemenea, utilizate ca intrare pentru analiza bazată pe gene. Metaanaliza dintre BD și IMC a identificat 64 de SNP-uri semnificative relevante pentru ambele trăsături (m-valoare> 0,9) (Tabelul 3).

Majoritatea SNP-urilor partajate între BD și IMC au fost localizate în regiuni intergenice (n = 26) sau într-un locus din cromozomul 16 care se întinde pe NPIPL1, SH2B1, TUFM, ATP2A1, AK125489, CLN3 și ATXN2L gene (n = 24 SNP; cel mai bun SNP: rs3888190, p = 1.1E - 24). Cinci SNP-uri erau localizate în ETV5 genă (cel mai bun SNP: rs1516725, p = 1.0E - 24), cinci în LINGO2 genă (cel mai bun SNP: rs2183824, p = 4.9E - 15), în timp ce restul de patru SNP-uri au fost localizate în NEGR1 (rs1620977, p = 8.7E - 13), MAP2K5 (rs2127162, p = 4.7E - 11), RPGRIP1L (rs1477199, p = 5.7E - 09) și DTX2P1 gene (rs4729098, p = 2.9E - 08). Interesant este că trei dintre aceste gene (RPGRIP1L, SH2B1 și ATP2A1) au fost incluse în căi îmbogățite semnificativ identificate de WebGestalt. Specific, RPGRIP1L a fost inclus în calea Semnalizare prin arici, în timp ce SH2B1 și ATP2A1 în calea hemostazei (Tabelul 2).

Un total de 11 SNP-uri localizate în trei gene s-a prezis că afectează legarea factorilor de transcripție de RegulomeDB (scor Tabelul 4 Rezultatele metaanalizei care arată SNPs asociate semnificativ cu tulburarea bipolară și diabetul de tip 2.

În cele din urmă, nu am găsit niciun SNP în comun între cele două meta-analize (adică SNP-uri semnificative atât în ​​comparațiile BD și IMC, cât și BD și T2D)

Discuţie

Studiul nostru susține existența unor factori genetici comuni între BD și IMC. Din cunoștințele noastre, acesta este primul studiu care a investigat genele asociate în mod obișnuit cu BD, IMC și T2D folosind o abordare bazată pe gene și fără un accent specific pe gene și căi unice candidate, sugerate anterior să fie implicate în BD. Am arătat că BD și IMC au un număr mai mare de gene de susceptibilitate comparativ cu BD și T2D. Unele gene pe care le-am găsit asociate cu BD și fie cu IMC, fie cu T2D (CACNA1D, ITIH4, NCAN, CRY2 și POMC) au fost raportate anterior printr-o revizuire sistematică recentă pentru a fi asociate cu fenotipuri cardiometabolice și tulburări de dispoziție (MDD și BD) 26. Pe lângă validarea acestor gene, am raportat multe ținte noi și am constatat că genele asociate în mod obișnuit cu BD și IMC sunt îmbogățite pentru termenul GO al corpului celular neuronal cu componentă celulară.

Abordarea metaanalizei a susținut, de asemenea, ipoteza că genele implicate în semnalizarea Hedgehog ar putea juca un rol important. De fapt, printre SNP-urile asociate semnificativ cu BD și IMC, rs1477199 a fost localizat în RPGRIP1L genă. Această genă codifică o proteină localizată în zona de tranziție a ciliului primar 56 și este necesară pentru dezvoltarea neuronului arcuat hipotalamic 57 . RPGRIP1L reprezintă o țintă deosebit de interesantă, deoarece expresia și activitatea sa sunt reglementate de variante intronice situate în FTO genă (care este puternic asociată cu obezitatea și T2D) prin reglarea pe distanțe lungi 58 . RPGRIP1L a fost recent asociat cu BD într-un eșantion care a inclus 276 de pacienți și 170 de martori de origine mexicană 59. Luate împreună, descoperirile noastre sugerează că abordările analitice complementare pot oferi dovezi convergente și ar trebui utilizate împreună pentru a putea identifica gene în care mai multe SNP-uri cu dimensiuni mici ale efectului ar putea avea un efect aditiv, precum și gene în care SNP-uri unice ar putea juca un rol mai relevant. Cele două abordări diferite pe care le-am utilizat susțin rolul potențial al semnalizării Hedgehog atât în ​​BD cât și în IMC.

Au fost relevate alte căi relevante împărțite între BD și IMC, cum ar fi „interacțiunile L1CAM”, care a fost implicată în neuritogeneză și neuroprotecție 60. Într-adevăr, molecula de adeziune a celulei neuronale L1 joacă un rol crucial în dezvoltarea sistemului nervos, fiind implicată în creșterea neuritei, aderența, ghidarea axonilor, mielinizarea și plasticitatea sinaptică 61. Studiile preclinice susțin ipoteza că nereglementarea plasticității sinaptice neuronale ar putea media un rol potențial al L1 și al altor molecule de aderență în patogeneza tulburărilor de dispoziție 62. În mod interesant, au fost sugerate modificări dependente de stat ale nivelurilor de ARN periferic L1 (ARNm) L1 la pacienții cu BD 63. Mai exact, nivelurile de L1 au fost crescute într-un eșantion de 13 pacienți cu BD într-o stare depresivă actuală, dar nu și la pacienții în stare remisivă (n = 29) 63 .

Rezultatele metaanalizei noastre au confirmat rolul important jucat de alte gene anterior sugerate a fi asociate cu BD și IMC. Mai exact, am găsit cinci SNP-uri care se află în ETV5 genă. Inhibarea ETV5 omolog în D. melanogaster (Ets96B) induce fenotipuri legate de BD și obezitate 20 .

Ipoteza noastră că variantele genetice ar putea contribui la explicarea creșterii comorbidității dintre BD și obezitate este în contrast cu rezultatele unui studiu recent care arată că includerea datelor genetice într-un model care conține caracteristici clinice nu a îmbunătățit predicția IMC sau a creșterii IMC după 1 an într-un eșantion de 284 de pacienți cu psihoză 29. Cu toate acestea, în acest studiu, doar 32 de pacienți au avut un diagnostic de BD, sugerând necesitatea efectuării unor studii suplimentare, inclusiv pacienții cu BD.

Este important de menționat că analizele noastre au fost efectuate pe subiecte de origine europeană. Vor fi necesare studii suplimentare pentru a evalua potențialul generalizabilității acestor rezultate pentru alte populații. În timp ce studiul nostru s-a concentrat asupra BD, alte tulburări psihiatrice, cum ar fi MDD și schizofrenia, prezintă o frecvență crescută a obezității 71. Un studiu recent care investighează rolul genei candidate CADM2, care codifică o moleculă de adeziune a celulei sinaptice, a raportat că această genă ar putea fi asociată cu o gamă largă de trăsături psihologice (nevrotism, instabilitate a dispoziției și asumarea riscurilor) și metabolice și că reglarea acestei gene în țesutul adipos ar putea media mecanisme biologice comune fenotipuri 72. În conformitate cu aceste rezultate, analiza noastră bazată pe gene a identificat această genă ca fiind asociată în mod obișnuit cu BD și IMC și această asociere a supraviețuit corecției testelor multiple. Studiile suplimentare vor trebui să înțeleagă care dintre țintele pe care le-am identificat ar putea fi specifice pentru BD și care gene sau căi ar putea juca un rol în diferite tulburări psihiatrice.

În concluzie, rezultatele noastre sugerează existența unor determinanți genetici comuni între BD și IMC și susțin relevanța genelor implicate în semnalizarea Hedgehog. Studiile care utilizează alte instrumente, cum ar fi PRS, pentru a evalua în continuare etiologia partajată între aceste trăsături, precum și pentru a evalua efectul agregat al mai multor variante cu dimensiuni mici ale efectului, sunt justificate. Sunt necesare studii viitoare privind eșantioane independente pentru care sunt disponibile informații despre comorbidități și potențiali factori de confuzie pentru a confirma rezultatele noastre și a explora rolul potențial al acestor gene în mecanismul de acțiune al stabilizatorilor de dispoziție la pacienții cu BD. În cele din urmă, pe baza faptului că unele dintre țintele și căile pe care le-am raportat că sunt asociate atât cu BD cât și cu IMC au fost implicate în mecanismul de acțiune al litiului, ar fi important să se exploreze dacă cel puțin o parte din factorii genetici comuni aceste trăsături ar putea juca un rol ca răspuns la acest stabilizator de dispoziție.

Disponibilitatea datelor

Seturile de date utilizate în acest articol sunt disponibile publicului și pot fi descărcate de pe site-urile web ale consorțiului psihiatric de genomică, consorțiului DIAGRAM și consorțiului GIANT.