Centrul Național pentru Creștere și Dezvoltare, Departamentul de Zoologie, Universitatea din Otago, 340 Great King Street, Dunedin 9054, Noua Zeelandă

pentru

Departamentul de Ecologie Comportamentală și Genetică Evolutivă, Institutul Max Planck pentru Ornitologie, Eberhard - Gwinner - Straße, 82319 Seewiesen, Germania

Departamentul de biologie evolutivă, Universitatea Bielefeld, Morgenbreede 45, 33615, Bielefeld, Germania

Centrul Național pentru Creștere și Dezvoltare, Departamentul de Zoologie, Universitatea din Otago, 340 Great King Street, Dunedin 9054, Noua Zeelandă

Departamentul de Ecologie Comportamentală și Genetică Evolutivă, Institutul de Ornitologie Max Planck, Eberhard - Gwinner - Straße, 82319 Seewiesen, Germania

Departamentul de biologie evolutivă, Universitatea Bielefeld, Morgenbreede 45, 33615, Bielefeld, Germania

rezumat

Utilizarea atât a modelelor liniare, cât și a celor cu efecte mixte liniare generalizate (LMM și GLMM) a devenit populară nu numai în științele sociale și medicale, ci și în științele biologice, în special în domeniul ecologiei și evoluției. Criteriile de informare, cum ar fi Akaike Information Criterion (AIC), sunt de obicei prezentate ca instrumente de comparare a modelelor pentru modele cu efecte mixte.

Prezentarea „varianței explicate” (R 2) ca statistică rezumativă relevantă a modelelor cu efecte mixte, este însă rară, chiar dacă R 2 este raportat în mod obișnuit pentru modelele liniare (LM) și, de asemenea, pentru modelele liniare generalizate (GLM). R 2 are proprietatea extrem de utilă de a oferi o valoare absolută pentru bunătatea potrivirii unui model, care nu poate fi dată de criteriile de informare. Ca o statistică sumară care descrie cantitatea de varianță explicată, R 2 poate fi, de asemenea, o cantitate de interes biologic.

Un motiv pentru subaprecierea R 2 pentru modelele cu efecte mixte constă în faptul că R 2 poate fi definit în mai multe moduri. În plus, cele mai multe definiții ale R 2 pentru efecte mixte au probleme teoretice (de exemplu, scăzute sau negative R 2 valori în modele mai mari) și/sau utilizarea lor este împiedicată de dificultăți practice (de exemplu, implementarea).

Aici, argumentăm importanța raportării R 2 pentru modelele cu efecte mixte. Mai întâi oferim definițiile comune ale R 2 pentru LM și GLM și discutați problemele cheie asociate cu calculul R 2 pentru modelele cu efecte mixte. Recomandăm apoi o metodă generală și simplă pentru calcularea a două tipuri de R 2 (marginal și condițional R 2) atât pentru LMM cât și pentru GLMM, care sunt mai puțin sensibile la probleme comune.

Această metodă este ilustrată prin exemple și poate fi folosită pe scară largă de cercetătorii din orice domeniu de cercetare, indiferent de pachetele software utilizate pentru montarea modelelor cu efecte mixte. Metoda propusă are potențialul de a facilita prezentarea R 2 pentru o gamă largă de circumstanțe.

Introducere

Multe seturi de date biologice au straturi multiple datorită naturii ierarhice a lumii biologice, de exemplu, celule din indivizi, indivizi din populații, populații din specii și specii din comunități. Prin urmare, avem nevoie de metode statistice care modelează în mod explicit structura ierarhică a datelor reale. Modelele cu efecte mixte liniare (LMM; denumite și modele pe mai multe niveluri/ierarhice) și extensia lor, modelele generalizate cu efecte mixte liniare (GLMM) formează o clasă de modele care încorporează ierarhii pe mai multe niveluri în date. Într-adevăr, LMM și GLMM devin o parte a seturilor de instrumente metodologice standard în științele biologice (Bolker și colab. 2009), precum și în științele sociale și medicale (Gelman & Hill 2007; Congdon 2010; Snijders & Bosker 2011). Utilizarea pe scară largă a GLMM-urilor demonstrează că o statistică care să rezume caracterul bun al adaptării modelului cu efecte mixte la date ar avea o mare importanță. În prezent, nu există o astfel de statistică sumară care să fie larg acceptată pentru modelele cu efecte mixte.

Mulți oameni de știință au folosit în mod tradițional coeficientul de determinare, R 2 (variind de la 0 la 1), ca statistică sumară pentru a cuantifica bunătatea potrivirii modelelor cu efecte fixe, cum ar fi regresii liniare multiple, anova, ancova și modele liniare generalizate (GLM). Conceptul de R 2, așa cum „varianța explicată” este intuitivă. pentru că R 2 este fără unități, este extrem de util ca index sumar pentru modelele statistice, deoarece se poate evalua obiectiv potrivirea modelelor și se poate compara R 2 valori între studii într-o manieră similară cu statisticile standardizate privind dimensiunea efectului în anumite circumstanțe (de exemplu, modele cu aceleași răspunsuri și un set similar de predictori sau cu alte cuvinte, poate fi utilizată pentru meta-analiză; Nakagawa și Cuthill 2007).

În Tabelul 1, rezumăm pe scurt 12 proprietăți ale R 2 (bazat pe Kvålseth 1985 și Cameron & Windmeijer 1996; compilație adoptată din Orelien & Edwards 2008) care va oferi cititorului un bun simț al ceea ce este un „tradițional” R Statistica 2 ar trebui să fie și să ofere, de asemenea, un punct de referință pentru generalizare R 2 la modele cu efecte mixte. Generalizând R 2 de la modele liniare (LM) la LMM și GLMM se dovedește a fi o sarcină dificilă. O serie de modalități de obținere R Au fost propuse 2 pentru modele mixte (de exemplu, Snijders & Bosker 1994; Xu 2003; Liu, Zheng & Shen 2008; Orelien & Edwards 2008). Aceste metode propuse, totuși, împărtășesc unele probleme teoretice sau dificultăți practice (discutate în detaliu mai jos) și, în consecință, nu există consens pentru o definiție a R 2 pentru modelele cu efecte mixte a apărut în literatura statistică. Prin urmare, nu este surprinzător că R 2 este raportat rareori ca statistică sumară a modelului atunci când sunt utilizate modele mixte.

Referințe de proprietate
R 2 trebuie să reprezinte o bunătate de potrivire și să aibă o interpretare intuitivă Kvålseth (1985)
R 2 trebuie să fie liber de unitate; adică adimensional Kvålseth (1985)
R 2 ar trebui să fie cuprins între 0 și 1, unde 1 reprezintă o potrivire perfectă Kvålseth (1985)
R 2 ar trebui să fie suficient de general pentru a se aplica oricărui tip de model statistic Kvålseth (1985)
R 2 valori nu ar trebui să fie afectate de diferite tehnici de montare a modelului Kvålseth (1985)
R 2 valori de la modele diferite montate pe aceleași date ar trebui să fie direct comparabile Kvålseth (1985)
Relativ R 2 valori ar trebui să fie comparabile cu alte măsuri acceptate de bunătate Kvålseth (1985)
Toate reziduurile (pozitive și negative) trebuie cântărite în mod egal cu R 2 Kvålseth (1985)
R 2 valori ar trebui să crească întotdeauna pe măsură ce se adaugă mai mulți predictori (fără corectarea gradelor de libertate) Cameron și Windmeijer (1996)
R 2 valori bazate pe suma reziduală de pătrate și cele bazate pe suma explicată de pătrate ar trebui să se potrivească Cameron și Windmeijer (1996)
R 2 valori și semnificația statistică a parametrilor pantei trebuie să arate corespondență Cameron și Windmeijer (1996)
R 2 ar trebui să poată fi interpretat din punct de vedere al conținutului informațional al datelor Cameron și Windmeijer (1996)

În lipsa R 2, criteriile de informare sunt adesea utilizate și raportate ca instrumente de comparație pentru modele mixte. Criteriile de informare se bazează pe probabilitatea datelor date unui model adecvat („probabilitatea”) penalizate de numărul de parametri estimați ai modelului. Criteriile de informare utilizate în mod obișnuit includ Criteriul de informare Akaike (AIC) (Akaike 1973), criteriul de informare bayesiană (BIC), (Schwarz 1978) și criteriul de informare a devianței mai recent propus (DIC), (Spiegelhalter și colab. 2002; revizuit în Claeskens & Hjort 2009; Grueber și colab. 2011; Hamaker și colab. 2011). Criteriile de informare sunt folosite pentru a selecta modelele „cele mai bune” sau „mai bune” și sunt într-adevăr utile pentru selectarea celor mai parsoniale modele dintr-un set de modele candidate (Burnham & Anderson 2002). Cu toate acestea, există cel puțin trei limitări importante ale utilizării criteriilor de informare în legătură cu R 2: (i) în timp ce criteriile de informații oferă o estimare a potrivirii relative a modelelor alternative, ele nu ne spun nimic despre potrivirea absolută a modelului (cf. raportul de dovezi; Burnham și Anderson 2002), (ii) criteriile de informare nu oferă orice informație privind varianța explicată de un model (Orelien și Edwards 2008) și (iii) criteriile de informare nu sunt comparabile în diferite seturi de date în niciun caz, deoarece sunt foarte specifice seturilor de date (cu alte cuvinte, nu sunt statistici de efect standardizate care pot să fie utilizat pentru meta-analiză; Nakagawa și Cuthill 2007).

În această lucrare, începem prin a furniza cele mai comune definiții ale R 2 în LM și GLM. Revizuim apoi definițiile propuse anterior de R 2 măsuri pentru modelele cu efecte mixte și discutați problemele și dificultățile asociate acestor măsuri. În cele din urmă, explicăm o metodă generală și simplă pentru calcularea varianței explicată de LMM și GLMM și ilustrăm utilizarea acesteia prin seturi de date ecologice simulate.

Definiții ale R 2

Am lăsat în mod deliberat -2 în numitor și numerator astfel încât („D” înseamnă „devianță”) poate fi comparat cu ecuația eqn 3. Pentru un LM (ecuația eqn 1), −2 log - statistica probabilității (uneori menționată la ca devianță) este egală cu suma reziduală a pătratelor bazate pe OLS ale acestui model (Menard 2000; vezi o serie de formule pentru răspunsuri non-gaussiene în Tabelul 1 din Cameron și Windmeijer 1997). Există mai multe alte definiții bazate pe probabilitate ale R 2 (revizuit în Cameron & Windmeijer 1997; Menard 2000), dar nu revizuim aceste definiții, deoarece acestea sunt mai puțin relevante pentru abordarea noastră de mai jos. În schimb, vom discuta despre generalizarea R 2 la LMM și GLMM și problemele asociate în acest proces, în secțiunea următoare.

Probleme frecvente la generalizare R 2

Unde yij este eual treilea răspuns al jal treilea individ, Xsalut este euvaloarea a jindivid individual pentru hal predictor, β0 este interceptarea, βh este panta (coeficientul de regresie) al hal predictor, αj este efectul individual individual dintr-o distribuție normală a efectelor individuale specifice cu media zero și varianța (între - varianța individuală) și εegr;ij este reziduul asociat cu euvaloarea a jindividul dintr-o distribuție normală a reziduurilor cu medie de zero și varianță de (varianță individuală). Așa cum s-a văzut în ecuațiile anterioare, LMM-urile au, prin definiție, mai mult de o componentă de varianță (în acest caz, două: și), în timp ce LM-urile au doar una (ecuațiile eqn 1 și eqn 2).

A doua problemă a extinderii și a modelelor cu mai mult de două niveluri a fost abordată de Gelman & Pardoe (2006), care oferă o soluție pentru extinderea și la orice număr arbitrar de niveluri (sau factori aleatori) într-un cadru bayesian. Cu toate acestea, implementarea sa generală este destul de dificilă și, prin urmare, ne referim la publicația originală pentru cei interesați de această metodă.

Primul obstacol al montării modelelor cu REML se aplică numai LMM-urilor, iar acest lucru poate fi rezolvat folosind estimările ML în loc de REML. Cu toate acestea, este bine cunoscut faptul că componentele varianței vor fi influențate atunci când modelele sunt montate de ML (de exemplu, Pinheiro & Bates 2000).

În ceea ce privește al doilea obstacol în ceea ce privește alegerea modelelor nule, se pare că ambele sunt permise și acceptate în literatură (de exemplu, Xu 2003; Orelien și Edwards 2008). Cu toate acestea, includerea factorilor aleatori în modelul de interceptare poate schimba cu siguranță probabilitatea modelului nul care este utilizat ca referință și, prin urmare, se schimbă R 2 valori. Aceasta se referă la o chestiune importantă. Pentru modele cu efecte mixte, R 2 poate fi clasificat în două categorii: marginal R 2 și condițional R 2 (Vonesh, Chinchilli & Pu 1996). Marginal R 2 se referă la varianța explicată prin factori fixi și condițională R 2 se referă la varianța explicată atât de factori fixi, cât și de factori aleatori. Până acum, ne-am concentrat doar pe primul, marginal R 2, dar vom detalia mai mult distincția dintre cele două tipuri în secțiunea următoare.

Deși nu examinăm toate definițiile propuse pentru R 2 pentru modelele cu efecte mixte aici (vezi Menard 2000; Xu 2003; Orelien & Edwards 2008; Roberts și colab. 2011), se pare că toate definițiile alternative ale R 2 suferă de una sau mai multe probleme menționate mai sus și implementările lor pot să nu fie simple. În secțiunea următoare, introducem o definiție a R 2, care este simplu și comun atât LMM-urilor, cât și GLMM-urilor și probabil mai puțin predispus la problemele menționate mai sus decât definițiile propuse anterior.