Grupul de lucru pSCANNER Natural Language Processing (NLP) dezvoltă capacitatea de a permite schimbul și refolosirea unor cantități vaste de informații valoroase de sănătate derivate din textele clinice ale tuturor institutelor participante la pSCANNER. Mai exact, aceasta implică crearea unor instrumente NLP generalizate și scalabile pentru extragerea fenotipurilor celor trei condiții de utilizare (adică Insuficiență cardiacă congestivă, obezitate și gestionarea greutății și boala Kawasaki) și stocarea rezultatelor ca un depozit de date al fenotipurilor pacienților în schema OMOP NLP propus de grupul de lucru OHDSI NLP gata să susțină studiile clinice. În prezent, grupul de lucru oferă următoarele capacități NLP pentru site-urile participante la pSCANNER, precum și alte CDRN-uri în PCORnet. Vă rugăm să contactați [email protected] pentru detalii.

CLEAN cNLP Ensemble and Pipeline

limbajului natural

Conducta de ansamblu NLP CLEAN (CLinical note rEview and ANnotation) este o platformă securizată, care păstrează confidențialitatea, pentru prelucrarea corpurilor mari de text clinic. CLEAN este capabil să asambleze diferite instrumente NLP într-un ansamblu care sinergizează puterea acestor instrumente pentru a maximiza calitatea rezultatului. CLEAN oferă, de asemenea, un instrument de adnotare interactiv care permite vizualizarea și revizuirea securizată a NLP, protejată de autentificarea în doi factori și de desktopul virtual. Aceste caracteristici se combină pentru a oferi extracție de înaltă calitate din corpusuri mari într-un interval de timp gestionabil.

CLEAN oferă următoarele servicii de procesare NLP:

  • De-identificare (de-ID)
  • De-duplicare
  • Extragerea elementelor de date
    • CLAMP http://clamp.uth.edu/
    • EFEx https://github.com/department-of-veterans-affairs/efex
    • cTAKES http://ctakes.apache.org/
    • MetaMap https://metamap.nlm.nih.gov/

Vă rugăm să contactați [email protected] pentru a utiliza CLEAN. Echipa CLEAN va colabora cu dvs. pentru a vă include instituția într-un RBI deja aprobat. Odată ce a fost aprobat, va fi creat un cont pentru a încărca, procesa și vizualiza în siguranță datele dvs. de text clinic.

Cadrul Leo

Infrastructura de procesare a limbajului natural (NLP) dezvoltată de VINCI este un set de servicii și biblioteci care facilitează crearea și implementarea rapidă a adnotatorilor Apache UIMA-AS axate pe procesarea limbajului natural. Suportul UIMA-AS permite Leo să gestioneze scala necesară procesării în timp real. Oferă instrumente de configurare la distanță pentru a permite optimizarea automată a sistemului. Cu utilitățile sale pentru dezvoltatori, funcționalitatea poate fi adăugată și integrată perfect cu serviciile NLP existente. Leo le permite utilizatorilor să genereze programatic descriptori ai motorului de analiză UIMA și descriptori de implementare.

O descriere detaliată a cadrului și ghidul utilizatorului pot fi găsite aici:

Dacă utilizați acest sistem, vă rugăm să citați:

Cornia R, Patterson OV, Ginter T, Duvall SL. Dezvoltare NLP rapidă cu Leo. În: AMIA Annu Symp Proc.; 2014.

Sistemul de extragere a semnelor vitale

Evaluarea semnelor vitale este o parte esențială a supravegherii pacienților cu afecțiuni critice pentru a detecta modificările stării și deteriorarea clinică. În timp ce cele mai multe dosare medicale electronice moderne permit înregistrarea elementelor vitale într-un format structurat, frecvența și calitatea a ceea ce este stocat electronic pot diferi de modul în care aceste măsuri sunt de fapt înregistrate. Am creat un instrument care extrage tensiunea arterială, ritmul cardiac, temperatura, frecvența respiratorie, saturația oxigenului din sânge și nivelul durerii din asistență medicală și alte note clinice înregistrate în cursul îngrijirilor pentru spitalizare pentru a completa datele structurate ale semnelor vitale.

Dacă utilizați acest sistem, vă rugăm să citați:

Patterson OV, Jones M, Yao Y, Viernes B, Alba PR, Iwashyna TJ, DuVall SL. Extragerea semnelor vitale din note clinice. Stud Health Technol Inform. 2015; 216: 1035. Disponibil de pe: http://www.ncbi.nlm.nih.gov/pubmed/26262334

EchoExtractor

Un sistem de procesare a limbajului natural care utilizează o căutare în dicționar, reguli și modele a fost dezvoltat pentru a extrage măsurători ale funcției cardiace care sunt de obicei înregistrate în rapoartele ecocardiogramei ca perechi de măsurare-valoare. Bootstrapping-ul semantic curat a fost folosit pentru a crea un dicționar personalizat care extinde terminologiile existente pe baza termenilor care apar în dosarul medical. O nouă metodă de dezambiguizare bazată pe constrângeri semantice a fost creată pentru a identifica și a elimina definițiile alternative eronate ale termenilor de măsurare. Sistemul a fost construit utilizând un cadru scalabil, făcându-l disponibil pentru procesarea seturilor de date mari.

EFEx

Una dintre cele mai solicitate variabile pentru cercetarea bolilor de inimă este fracția de ejecție a ventriculului stâng (FEV). LVEF este o măsură a funcției inimii și se exprimă ca procent din volumul total de sânge pompat din inimă la fiecare bătăi. Doar o mică parte din valorile LVEF sunt disponibile ca date structurate în sistemul electronic de evidență medicală VA; majoritatea sunt înregistrate în note și rapoarte. Pentru a îmbunătăți disponibilitatea datelor LVEF, VINCI a dezvoltat un sistem NLP pentru a extrage valorile LVEF din aceste documente clinice. Sistemul a fost validat cu o precizie de peste 98% pentru diferite tipuri de documente.

CLAMP

Setul de instrumente CLAMP (Clinical Language Annotation, Modeling, and Processing) este un software clinic complet NLP care permite recunoașterea și codificarea automată a informațiilor clinice în rapoartele narative ale pacienților. Componentele CLAMP sunt construite pe metode dovedite în multe provocări clinice ale PNL. CLAMP este personalizabil și permite utilizatorilor să aleagă dintre diferite opțiuni de componente NLP și Machine Learning, să adnote documente țintă, să genereze modele și să proceseze note clinice.