În această disertație, evaluăm mai întâi asocierile dintre metaboliții circulanți și indicele de masă corporală în două S.U.A. cohorte prospective. Apoi, propunem mai multe metode pentru a analiza mai multe fenotipuri în studii de asociere genetică bazate pe statistici sumare.

metabolomica

În capitolul 1, investigăm asocierile dintre metaboliții circulanți și indicele de masă corporală (IMC) măsurat în mod repetat în rândul bărbaților și femeilor caucaziene. Am folosit modele mixte liniare cu un termen de interceptare aleatorie pentru a ține cont de corelația dintre subiecți și pentru a ne ajusta pentru potențialii factori de confuzie de bază, inclusiv starea de bază a obezității, fumatul, activitatea fizică, consumul de alcool, aportul caloric total, vârsta la extragerea sângelui și anii de urmărire . Nu am găsit că asociațiile erau eterogene între bărbații și femeile caucaziene și, prin urmare, am folosit un efect de meta-analiză fix pentru a combina înregistrările asociațiilor din aceste două cohorte. Am constatat că valina, leucina și izoleucina au fost asociate pozitiv cu IMC, în timp ce acetilglicina a fost asociată negativ cu IMC.

În capitolul 2, prezentăm teste de scor pe bază de model mixt liniar pentru detectarea variantelor genetice pleotrope care sunt asociate cu multiple trăsături corelate pe baza statisticilor sumare. Testele noastre sunt robuste pentru a efectua eterogenitatea și structurile de corelație între mai multe trăsături. Am realizat studii de simulare pentru a compara metodele propuse cu metodele existente. De asemenea, am aplicat metodele noastre unui set global de date statistice sumare GWAS lipidice și am identificat sute de variante genetice noi.

În capitolul 3, propunem o perspectivă geometrică asupra puterilor testelor de asociere a componentelor principale bazate pe statistici rezumative GWAS. Folosind analiza proprie a matricei de corelație și analiza puterii asimptotice, investigăm când PCA este puternic și când nu este pentru a detecta semnalele genetice. În continuare, aplicăm metodele noastre la un set global de date ale studiului de asociere la nivel global al lipidelor și identificăm sute de variante genetice noi care au fost ratate de abordările convenționale de analiză cu o singură trăsătură. Rezultatele noastre pot ajuta ghidarea cercetătorilor să aleagă metode PCAT puternice în studii multiple de asociere a fenotipului și, de asemenea, să interpreteze mai bine rezultatele asocierii.