Date asociate

Abstract

Deoarece multe boli prezintă un răspuns eterogen la tratament, există un interes crescând în individualizarea tratamentului la pacienți [11]. O regulă de tratament individualizată este o regulă de decizie care recomandă tratamentul în funcție de caracteristicile pacientului. Considerăm utilizarea datelor studiilor clinice în construcția unei reguli de tratament individualizate care să ducă la cel mai mare răspuns mediu. Aceasta este o problemă de calcul dificilă, deoarece funcția obiectivă este așteptarea unei funcții de indicator ponderat care nu este concavă în parametri. Mai mult, există frecvent multe variabile de pretratare care pot sau nu să fie utile în construirea unei reguli optime de tratament individualizat, dar considerațiile de cost și interpretabilitate implică faptul că doar câteva variabile ar trebui utilizate de regula tratamentului individualizat. Pentru a aborda aceste provocări, luăm în considerare estimarea bazată pe l1 penalizate cu cele mai mici pătrate. Această abordare este justificată printr-un eșantion finit, limita superioară a diferenței dintre răspunsul mediu datorat regulii de tratament individualizate estimate și răspunsul mediu datorat regulii de tratament optimizate individualizate.

performanță

1. Introducere

Multe boli prezintă un răspuns eterogen la tratament. De exemplu, un studiu privind schizofrenia [12] a constatat că pacienții care iau același antipsihotic (olanzapină) pot avea răspunsuri foarte diferite. Unii ar putea fi nevoiți să întrerupă tratamentul din cauza evenimentelor adverse grave și/sau a simptomelor agravate acut, în timp ce alții pot prezenta evenimente adverse puține, dacă există, și au rezultate clinice îmbunătățite. Rezultatele de acest tip au motivat cercetătorii să susțină individualizarea tratamentului pentru fiecare pacient [16, 24, 11]. Un pas în această direcție este estimarea nivelului de risc al fiecărui pacient și apoi potrivirea tratamentului cu categoria de risc [5, 6]. Cu toate acestea, această abordare este cel mai bine utilizată pentru a decide dacă se tratează; în caz contrar, își asumă cunoașterea celui mai bun tratament pentru fiecare categorie de risc. Alternativ, există o abundență de literatură axată pe prezicerea prognosticului fiecărui pacient sub un anumit tratament [10, 28]. Astfel, o modalitate evidentă de individualizare a tratamentului este de a recomanda tratamentul care realizează cel mai bun prognostic prezis pentru acel pacient. În general, scopul este de a utiliza datele pentru a construi reguli de tratament individualizate care, dacă vor fi implementate în viitor, vor optimiza răspunsul mediu.

Propunem să estimăm o regulă optimă de tratament individualizat utilizând o procedură în doi pași care estimează mai întâi răspunsul mediu condiționat folosind l1-PLS cu un model liniar bogat și în al doilea rând, derivă regula de tratament estimată din media condițională estimată. Pentru scurtă durată, numim de-a lungul procedurii în doi pași metoda l1-PLS. Obținem mai multe limite superioare ale eșantionului finit pe diferența dintre răspunsul mediu la regula de tratament optimă și răspunsul mediu la regula de tratament estimată. Toate limitele superioare sunt valabile chiar dacă modelul nostru liniar pentru răspunsul condițional mediu este incorect și, din câte știm, sunt, până la constante, cele mai bune disponibile. Folosim limitele superioare din secțiunea 3 pentru a ilumina potențialele nepotriviri între utilizarea celor mai mici pătrate în procedura în doi pași și scopul de a maximiza răspunsul mediu. Limitele superioare din secțiunea 4.1 implică o sumă minimizată a erorii de aproximare și a erorii de estimare; ambele erori rezultă din estimarea răspunsului mediu condiționat. Vom vedea că l1-PLS estimează un model liniar care minimizează această aproximare plus suma de erori de estimare dintr-un set de modele liniare rare.

Dacă partea modelului pentru media condițională care implică efectul tratamentului este corectă, atunci limitele superioare implică faptul că, deși se utilizează o procedură surogată în două etape, regula de tratament estimată este consecventă. Limitele superioare oferă, de asemenea, o rată de convergență. În plus, în această setare, limitele superioare pot fi folosite pentru a informa cum să alegeți parametrul de reglare implicat în penalitatea l1 pentru a obține cea mai bună rată de convergență. Ca produs secundar, această lucrare contribuie, de asemenea, la literatura existentă despre l1-PLS, oferind o eroare de predicție a eșantionului finit legată de estimatorul l1-PLS în setarea de proiectare aleatorie, fără a presupune că clasa modelului conține sau este apropiată de modelul adevărat.

Lucrarea este organizată după cum urmează. În secțiunea 2, formulăm problema luării deciziilor. În secțiunea 3, pentru orice decizie dată, de ex. regula tratamentului individualizat, raportăm reducerea răspunsului mediu la eroarea de predicție în exces. În secțiunea 4, estimăm o regulă optimă de tratament individualizat prin l1-PLS și oferim un eșantion finit la limita superioară a reducerii maxime a răspunsului mediu optim realizat de regula estimată. În secțiunea 5, considerăm un criteriu de selectare a parametrilor de reglare dependenți de date. Această metodă a fost evaluată folosind studii de simulare și ilustrată cu date din studiul Nefazodone-CBASP [13]. Discuțiile și lucrările viitoare sunt prezentate în secțiunea 6.

2. Reguli de tratament individualizate

Folosim litere mari pentru a indica variabile aleatorii și litere mici pentru a indica valorile variabilelor aleatoare. Luați în considerare datele dintr-un studiu randomizat. Pe fiecare subiect avem variabilele de pretratare X ∈, tratamentul A luând valori într-un spațiu de tratament finit, discret și un răspuns cu valoare reală R (presupunând că valorile mari sunt de dorit). O regulă de tratament individualizată (ITR) d este o regulă de decizie deterministă din spațiul de tratament .

Denotați distribuția lui (X, A, R) de către P. Aceasta este distribuția datelor studiilor clinice; în special, denotați distribuția de randomizare cunoscută a lui A dată X de p (· | X). Probabilitatea ca (X, A, R) sub P este apoi f0 (x) p (a | x) f1 (r | x, a), unde f0 este densitatea necunoscută a lui X și f1 este densitatea necunoscută a lui R condițional pe (X, A). Notați așteptările cu privire la distribuția P de către un E. Pentru orice ITR d: →, să denotăm P d distribuția (X, A, R) în care d este utilizat pentru a atribui tratamente. Atunci probabilitatea (X, A, R) sub P d este f0 (x) 1a = d (x) f1 (r | x, a). Indicați așteptările cu privire la distribuția P d de un E d. Valoarea lui d este definită ca V (d) = E d (R). Un ITR optim, d0, este o regulă care are valoarea maximă, adică.

unde argmax este peste toate regulile de decizie posibile. Valoarea d0, V (d0), este valoarea optimă.

Să presupunem că P [p (a | X)> 0] = 1 pentru toate a ∈ (adică toate tratamentele sunt posibile pentru toate valorile lui X a.s.). Atunci P d este absolut continuu față de P și o versiune a derivatului Radon-Nikodym este dP d/dP = 1a = d (x)/p (a | x). Astfel Valoarea lui d satisface

Scopul nostru este să estimăm d0, adică ITR care maximizează (2.1), utilizând date din distribuția P. Când X este dimensional redus și se dorește cea mai bună regulă într-o clasă simplă de ITR, versiunile empirice ale valorii pot fi utilizate pentru a construi estimatori [21, 27]. Cu toate acestea, dacă este de interes cea mai bună regulă dintr-o clasă mai mare de ITR-uri, aceste abordări nu mai sunt fezabile.

Astfel V (d0) = E [Q0 (X, d0 (X))] ≤ E [maxa∈Q0 (X, a)]. Pe de altă parte, prin definiția lui d0,

Prin urmare, un ITR optim satisface d0 (X) ∈ arg maxa∈ Q0 (X, a) a.s.

3. Corelarea reducerii valorii cu excesul de eroare de predicție

Argumentul de mai sus indică faptul că ITR estimat va fi de înaltă calitate (adică va avea o valoare ridicată) dacă putem estima cu precizie Q0. În această secțiune, justificăm acest lucru oferind o relație cantitativă între valoare și eroarea de predicție.

Deoarece este un spațiu de tratament finit, discret, având în vedere orice ITR, d, există o funcție pătrată integrabilă Q: × → ℝ pentru care d (X) ∈ arg maxa Q (X, a) a.s. Fie L (Q) ≜ E [R - Q (X, A)] 2 denotă eroarea de predicție a lui Q (numită și pierderea medie pătratică). Să presupunem că Q0 este pătrat integrabil și că probabilitatea de randomizare satisface p (a | x) ≥ S −1 pentru un S> 0 și toate (x, a) perechi. Murphy [23] a arătat că

Intuitiv, această limită superioară înseamnă că, dacă eroarea de predicție în exces a lui Q (adică E (R - Q) 2 - E (R - Q0) 2) este mică, atunci reducerea valorii ITR d asociată (adică V) ( d0) - V (d)) este mic. Mai mult, limita superioară oferă o rată de convergență pentru un ITR estimat. De exemplu, să presupunem că Q0 este liniar, adică Q0 = Φ (X, A)θ0 pentru o funcție de bază dată vectorială Φ pe × și un parametru necunoscut θ0. Și să presupunem că folosim un model liniar corect pentru Q0 (aici „liniar” înseamnă liniar în parametri), să spunem modelul = X, A)θ: θ → ℝ dim (Φ)> sau un model liniar care conține dimensiunea parametrilor fixați în n. Dacă estimăm θ prin pătrate minime și denotați estimatorul prin θ ̂ , apoi eroarea de predicție a lui Q ̂ = Φ θ ̂ converge la L (Q0) la rata 1/n în condiții de regularitate ușoară. Acest lucru împreună cu inegalitatea (3.1) implică faptul că valoarea obținută prin ITR estimat, d ̂ (X) ∈ arg maxa Q ̂ (X, a), va converge la valoarea optimă la o rată de cel puțin 1/n .