Subiecte

Abstract

Introducere

Materiale și metode

Eșantion de date și preprocesare

Studiul a fost realizat ca parte a ASD-Net, o rețea de cercetare cu accent pe ASD, finanțată de ministerul federal german al educației și cercetării 44. Toate datele despre participanți au provenit din patru clinici ambulatorii specializate pentru TSA din Germania, unde au fost aplicate procedurile actuale de diagnostic standard pentru confirmarea sau excluderea unui diagnostic de TSA. Toți participanții au fost direcționați de specialiști sau autorizați la secțiile de ambulatoriu. Datele participanților au fost colectate retrospectiv din fișele medicale ale clinicii respective (revizuirea retrospectivă a diagramelor) și combinate într-un singur set de date pentru analiză. Această procedură a fost aprobată de comitetul de etică Charité - Universitätsmedizin Berlin (EA4/129/19) și datorită naturii retrospective a colectării și analizei datelor bazate pe date clinice obținute în mod curent, necesitatea consimțământului informat a fost renunțată de comitetul de etică local. Toate metodele au fost efectuate în conformitate cu ghidurile și reglementările instituționale și internaționale de cercetare relevante.

Procedura de diagnostic a implicat o observare standardizată a comportamentului în toate cazurile (ADOS Module 4 10), un interviu standardizat dacă informațiile părintești erau disponibile (ADI-R 12; îngrijitorii erau disponibili în 62% din toate cazurile (ASD: 71%, non -ASD: 50%)) și un examen diferențial de diagnostic (chestionare structurate stabilite și interviuri clinice structurale utilizate frecvent în țările vorbitoare de limbă germană), care au ajutat clinicienii instruiți și cu experiență în atingerea unui diagnostic clinic cu cea mai bună estimare. Au fost disponibile evaluări multiple pentru unele dintre cazuri, cu toate acestea, doar cea mai recentă evaluare a fost luată în considerare pentru fiecare caz.

Eșantionul nostru a inclus date din 673 de cazuri, dintre care 57% au primit un diagnostic de ASD („ASD”, n = 385) și 43% nu au primit un diagnostic de ASD, dar diagnostice diferențiale relevante, cum ar fi tulburările afective, tulburările de anxietate, ADHD și/sau tulburări de personalitate sau niciun diagnostic psihiatric actual („non-ASD”, n = 288; pentru o descriere mai detaliată a diversității fenotipice vezi Tabelul suplimentar 1). Subtipurile ASD conform ICD-10 (F84.0, F84.1, F84.5) au fost grupate împreună, oferindu-ne o măsură binară a rezultatului claselor „ASD” și „non-ASD” pentru procedurile noastre de învățare automată. Nu a existat nicio diferență semnificativă între cele două grupuri în ceea ce privește vârsta, sexul și coeficientul de inteligență (Tabelul 1).

ADOS este o scară de observație standardizată concepută pentru a surprinde comportamente social-comunicative importante și trăsături comportamentale stereotipe și repetitive 10. În modulul 4, care este destinat adolescenților și adulților fluenți verbal, aceste aspecte sunt codificate pe 31 de elemente diferite. Codurile cad pe o scară ordinală de la 0 (fără anomalii legate de autism) la 2 (dovezi certe de anomalie) și uneori 3 (severitate profundă), cu coduri suplimentare de 7 și 8 pentru comportament anormal sau comportament care nu este prezentat în timpul observării și un cod de 9 pentru valorile lipsă (adică răspunsurile omise sau lăsate necompletate).

Modulul 4 ADOS oferă un algoritm de notare care constă dintr-un subset al celor 11 elemente diagnostice cele mai informative (a se vedea Tabelul 2) din domeniile Interacțiune socială și comunicare pentru calcularea unui scor de comparație, care produce o clasificare a instrumentului de autism, spectru autist sau non -spectru.

Pentru preprocesarea datelor pentru analizele noastre de învățare automată, am recodificat codurile ADOS de la 3 la 2 și codurile de la 7 și 8 la manualul analog ADOS. Valorile lipsă (adică codurile de 9) au fost imputate folosind k imputarea celui mai apropiat vecin cu k = 5knnImpute) folosind built-in-ul preproces () funcția din pachetul caret R 45. În setul nostru de date, șase articole lipseau în 4-10% din toate cazurile (articolele A6, B4, C1, E1, E2, E3), cu toate celelalte articole lipseau răspunsurile în mai puțin de 2,5% din cazuri (pentru un detaliu mai detaliat) descriere privind distribuția codurilor ADOS și a valorilor lipsă în eșantionul nostru, consultați Tabelul suplimentar 2). În plus, toate variabilele numerice au fost normalizate pentru a varia [0; 1].

Învățare automată

Experimentele anterioare de clasificare au folosit diverse tehnici de învățare automată, inclusiv mașini vectoriale de suport, modele bazate pe copaci și modele liniare generale 32. În aceste publicații anterioare, mașinile vectoriale de suport (SVM) s-au numărat printre modelele care au avut cele mai bune performanțe 36,41,42. Mai mult, SVM este unul dintre algoritmii cei mai frecvent utilizați, care a fost utilizat pentru clasificarea ASD datorită puterii sale predictive ridicate 32. Prin urmare, am decis să folosim clasificarea SVM cu nucleul radial folosind svmRadial al pachetului caret R 45 ca clasificator de învățare automată. Am efectuat o analiză suplimentară folosind pădure aleatorie, care a arătat o performanță predictivă ușor mai mică. Datorită constrângerilor de lizibilitate și spațiu, prezentăm doar rezultate pentru SVM. Rezultatele analizei noastre forestiere aleatorii pot fi găsite în supliment (a se vedea tabelul suplimentar 3).

Toate cele 31 de articole ADOS au fost utilizate ca trăsături, iar diagnosticul clinic cel mai bine estimat al indivizilor a fost utilizat ca clasă de predicție (ASD vs. non-ASD). Toate etapele inspecției și preprocesării datelor, inclusiv imputarea și analiza, au fost efectuate folosind versiunea R 3.5.1 în Rstudio 1.1.456.

Pentru a compara performanțele modelului, am evaluat ASC ale predicțiilor obținute din noul nostru set de caracteristici reduse vs. toate cele 31 de articole din ADOS vs. subsetul de 11 itemi propuși de algoritmul ADOS. În plus, am comparat modelul de performanță cu clasificatorul cu 12 articole identificat anterior de Kosmicki și colegii 41 în experimentele lor privind copiii și adolescenții, astfel cum au fost evaluați cu modulul ADOS 3 (pentru o listă a acestor articole, vezi Tabelul 2). Pentru evaluarea diferențelor în ceea ce privește ASC, ne-am bazat pe testul 48 al DeLong pentru două curbe ROC corelate, precum și pe un test de semnificație a reeșantionării bootstrap 49,50 pentru două curbe ROC corelate (comparând de fiecare dată suprapunerea intervalelor de încredere cu 10.000 de iterații bootstrappate).

Datorită unei distribuții generale de vârstă în eșantionul nostru (vârste cuprinse între 10 și 72 de ani, cu o vârstă mediană de 22 de ani), toate etapele menționate mai sus au fost efectuate în întregul eșantion („toate vârstele”, N = 673 ), precum și în subgrupele de vârstă ale adolescenților cu vârsta ≤21 ani („adolescenți”, n = 321, 56,7% ASD (n = 182)) și adulți cu vârsta> 21 ani („adulți”, n = 352, 57,7% ASD ( n = 203)). Pentru informații suplimentare cu privire la distribuția în funcție de vârstă a eșantionului nostru și a subgrupurilor de vârstă, consultați Tabelul suplimentar 4 și figurile suplimentare 1 la 3.

Rezultate

Privind întregul eșantion, algoritmul nostru de selectare a caracteristicilor recursive a selectat cinci caracteristici ca fiind cele mai importante, adică cei care au avut în medie cea mai mare capacitate de a prezice adolescenții și adulții cu TSA comparativ cu adolescenții și adulții cu alte prezentări clinice complexe în timpul validării încrucișate: Caracteristici A9 (Gesturi descriptive, convenționale, instrumentale sau informaționale), B1 (contact vizual neobișnuit), B2 (Expresii faciale adresate altora), B10 (Calitatea răspunsului social) și B11 (Suma comunicării sociale reciproce). Toate cele cinci caracteristici selectate corespund domeniilor de interacțiune socială și comunicare a ADOS și sunt cuprinse în algoritmul ADOS original cu 11 caracteristici, precum și în clasificatorul cu 12 articole propus de Kosmicki și colegii 41 (Tabelul 2). Itemii A9, B1 și B2 descriu anomalii în comunicarea reciprocă nonverbală și interacțiunea participantului observate în timpul examinării ADOS, în timp ce itemii B10 și B11 constituie itemi rezumativi calitativi, în care clinicianul evaluează anomaliile comportamentelor sociale generale ale participantului în timpul examinării ADOS.

Cu acest subset de caracteristici reduse de doar 5 caracteristici, am observat o ASC de 0,87 (sensibilitate = 0,72, specificitate = 0,87) în setul de antrenamente, care este comparabilă cu performanța modelului cu 11 caracteristici al algoritmului ADOS, 31- model de caracteristici utilizând toate elementele ADOS și subsetul de 12 elemente identificate de Kosmicki și colegii 41 (toate ASC de 0,87; vezi Tabelul 4).

Pentru validarea independentă a clasificatorilor noștri, am calculat performanța modelelor pe setul de testare rezistență. Atunci când se prezicea în mod independent diagnosticul clinic cu cea mai bună estimare, modelele noastre au obținut ASC ușor mai mici (vezi Tabelul 4): modelul nostru cu 5 caracteristici reduse a atins ASC de 0,82 (sensibilitate = 0,71, specificitate = 0,83) comparativ cu ASC de 0,84 din cele 11 -modelul caracteristicilor (sensibilitate = 0,85, specificitate = 0,76), modelul cu 12 caracteristici propus de Kosmicki și colab. 41 (sensibilitate = 0,77, specificitate = 0,82) și modelul cu 31 de caracteristici (sensibilitate = 0,79, specificitate = 0,81; Tabelul 4, Fig. 1).

predictive

Curbele caracteristicii de funcționare a receptorului (ROC) care evaluează puterea predictivă în setul de testare pentru întreaga probă („toate vârstele”). Pragul ROC optim cu cea mai mare sumă de sensibilitate + specificitate este reprezentat 61 .

Într-un ultim pas, am comparat performanțele modelelor. Nu s-au găsit diferențe semnificative la compararea ASC ale modelului redus cu 5 caracteristici cu modelul cu 11 caracteristici sugerat de algoritmul ADOS (testul lui DeLong: Z = -1,63, p = 0,10; bootstrapping: D = -1,61, p = 0,11, numărul de bootstrapped resamplat = 10 000), modelul cu 12 caracteristici propus de Kosmicki și colab. 41 (Testul lui DeLong: Z = −1,27, p = 0,20; bootstrapping: D = −1,26, p = 0,21, numărul de bootstrapped resamplat = 10 000) și modelul cu 31 de caracteristici (testul lui DeLong: Z = −1,29, p = 0,20; bootstrapping: D = −1,26, p = 0,21, numărul de reeșantioane bootstrapped = 10 000).

Rezultatele separat pentru subgrupuri de vârstă („adolescenți” și „adulți”) pot fi găsite în Tabelul 5. Comparativ cu întregul nostru subset de caracteristici eșantion („toate vârstele”: itemi A9, B1, B2, B10, B11), selecția noastră de caracteristici recursive algoritmul a selectat caracteristici ușor diferite ca cele mai importante pentru subgrupurile de vârstă specifice: itemi A9, B1, B2, B3, B9 pentru „adolescenți” vs. articolele A9, B2, B3, B9, B10 pentru „adulți”. Similar cu subsetul de caracteristici „toate vârstele”, totuși, toate caracteristicile selectate corespund domeniilor de interacțiune socială și comunicare ADOS. Două elemente (B3 (Producția limbii și comunicarea nonverbală legată) și B9 (Calitatea Overturilor sociale) au fost incluse în ambele subgrupuri de vârstă, dar nu în eșantionul „toate vârstele”. Itemul B9 este un element rezumativ calitativ care evaluează calitatea generală a încercările individului de a iniția interacțiuni sociale, în timp ce itemul B3 conține informații despre modul în care vocalizările individului sunt însoțite de comportamente nonverbale (cum ar fi contactul vizual, gesturile și expresia feței).

Prin împărțirea eșantionului „toate vârstele” în subgrupuri de vârstă, am reușit să creștem precizia generală de predicție a modelelor noastre (vezi Tabelul 5). Comparativ cu întregul eșantion, nu au existat diferențe semnificative între ASC ale modelelor cu 5 caracteristici („adolescenți”: ASC = 0,90; „adulți”: ASC = 0,84), modelul cu 11 caracteristici propus de adolescenții algoritmului ADOS ”: ASC = 0,88; „adulți”: ASC = 0,87), modelul cu 31 de caracteristici (adolescenți ”: ASC = 0,87;„ adulți ”: ASC = 0,87) și modelul cu 12 caracteristici propus de Kosmicki și colab. 41 („adolescenți”: ASC = 0,84; „adulți”: ASC = 0,85) în seturile de testare din subgrupurile respective. Pentru o descriere detaliată a rezultatelor testelor de comparație, precum și a curbelor ROC pentru subgrupurile de vârstă, consultați Figurile Suplimentare 4 și 5.

Discuţie

Prin împărțirea eșantionului nostru în subgrupuri de vârstă de adolescenți (≤21 ani) și adulți (> 21 ani), am reușit să creștem și mai mult precizia de predicție a subseturilor noastre „„ adolescenți ”prescurtate cu 5 caracteristici: ASC de 90%; „Adulți”: ASC de 84%). Similar cu întregul eșantion („toate vârstele”), nu am găsit diferențe semnificative la compararea performanței generale de predicție a diferitelor modele („adolescenți”: ASC de 90% (5 caracteristici) vs. 88% (11 caracteristici) vs. 87% (31 de caracteristici) vs. 84% (12 caracteristici propuse de Kosmicki și colab. 41); „Adulți”: ASC de 84% (5 caracteristici) vs. 87% (11 caracteristici) vs. 87% (31 de funcții) vs. 85% (12 caracteristici propuse de Kosmicki și colab. 41)) în subgrupurile respective.

În plus, eșantionul nostru a constat din indivizi cu funcționare ridicată, dintre care cei mai mulți s-au prezentat târziu în viață pentru un diagnostic de TSA, aparținând astfel probabil sfârșitul ușor al spectrului. Prin urmare, rezultatele nu pot fi generalizate la întregul spectru ASD, în special la acei indivizi cu funcționare intelectuală mai scăzută.

În cele din urmă, criteriul nostru de rezultat (diagnosticul clinic cu cea mai bună estimare a ASD vs. non-ASD) nu a fost independent de caracteristicile utilizate pentru construirea algoritmului de predicție, prin urmare este posibil să ne confunde rezultatele. Această problemă a circularității a fost discutată anterior, cu toate acestea, în prezent nu există modalități de abordare satisfăcătoare a acestei probleme, deoarece nu există un criteriu extern independent disponibil (pentru o discuție mai detaliată a se vedea 20.41). Cu toate acestea, chiar dacă ADOS a fost de obicei inclus în luarea deciziilor clinice, nu a determinat doar diagnosticul.

Concluzie

Luate împreună, rezultatele noastre reprezintă un pas important înainte spre îmbunătățirea detectării ASD la persoanele în vârstă și aruncă o oarecare lumină, în special în problema dificilă a diagnosticului diferențial în cazurile complexe clinic. Am identificat subseturi reduse de caracteristici comportamentale din modulul ADOS 4 pentru întregul eșantion, precum și adolescenți și adulți separat, care au prezentat performanțe de clasificare comparabile cu cea a ADOS complet și a algoritmului ADOS existent. În timp ce toate articolele din ADOS se concentrează pe concepte comportamentale relevante, elementele identificate pot avea o capacitate mai mare de a diferenția indivizii cu TSA de indivizii cu alte prezentări clinice complexe în adolescență și maturitate. Deși sunt necesare studii suplimentare pentru a evalua capacitatea acestor clasificatori reduși de a generaliza la date complet noi și nevăzute și pentru a determina valoarea clinică a acestora, aceste rezultate pot contribui la îmbunătățirea procesului complicat de diagnosticare a ASD la adolescenți și adulți, încurajând eforturile viitoare de îmbunătățire a diagnosticului existent. instrumente precum ADOS, ajutând astfel clinicienii în special în problema dificilă a diagnosticului diferențial, precum și să dezvolte noi instrumente de diagnostic pentru detectarea ASD.

Disponibilitatea datelor

Seturile de date generate și analizate în cursul studiului actual nu sunt disponibile publicului din cauza confidențialității medicale, dar sunt disponibile de la primul autor la cerere rezonabilă, în așteptarea aprobării coautorilor.