Zdroje veľkých údajov v medicíne

by Kevin Hwang, MD, MPH; Posúdené Richard N. Fogoros, MD

Jednoduchá definícia veľkých údajov v medicíne je "súhrn údajov týkajúcich sa zdravotnej starostlivosti a blahobytu pacienta" (Raghupathi 2014). Ale čo presne sú tieto typy údajov a odkiaľ pochádzajú?

Nasleduje široký prehľad o typoch a zdrojoch veľkých údajov, ktoré sú predmetom záujmu poskytovateľov zdravotnej starostlivosti, výskumníkov, platiteľov, tvorcov politík a priemyslu.

Tieto kategórie sa navzájom nevylučujú, pretože rovnaké údaje môžu pochádzať z rôznych zdrojov.

Ani tento zoznam nie je vyčerpávajúci, pretože praktické využitie veľkých dátových analytikov sa bude neustále rozširovať.

Klinické informačné systémy

Ide o tradičné zdroje klinických údajov, ktoré poskytovatelia zdravotnej starostlivosti zvykli na zobrazenie.

Elektronické zdravotné záznamy (EHR) zhromažďujú, ukladajú a zobrazujú informácie, ako sú demografické údaje, predchádzajúca anamnéza, aktívne zdravotné problémy, očkovanie, alergie, lieky, vitálne znaky, laboratórne a rádiologické testy, poskytovateľov a administratívnych a finančných dokumentov
Elektronické zdravotné záznamy (EMR) nie sú identické s EHR a zvyčajne sa týkajú údajov uložených u konkrétneho lekára.
Výmena informácií o zdravotníctve slúži ako centrum medzi rôznymi klinickými informačnými systémami

Registre pacientov, ktoré udržiavajú zdravotnícke organizácie na vlastných pacientoch, sú často spojené s EHR. Ďalšie registre sledujú očkovanie, rakovinu, traumu a ďalšie otázky verejného zdravia v širšom geografickom meradle.

Portály pacientov umožňujú pacientom prístup k osobným zdravotným informáciám uloženým v EHR organizácie zdravotnej starostlivosti. Niektoré portály pre pacientov tiež umožňujú používateľom požiadať o doplnenie na predpis a výmenu bezpečných elektronických správ s tímom zdravotnej starostlivosti.

Klinické dátové sklady zhromažďujú údaje na úrovni pacientov z viacerých klinických informačných systémov, ako sú EHR a iné zdroje uvedené vyššie

Vyžaduje údaje od platiteľov

Verejní plátci (napr. Medicare) a súkromní platitelia majú veľké úložiská údajov o pohľadávkach na svojich príjemcov. Niektoré zdravotné poisťovne teraz tiež ponúkajú stimuly na zdieľanie vašich zdravotných údajov.

Výskumné štúdie

Databázy výskumu obsahujú informácie o účastníkoch štúdie, experimentálnej liečbe a klinických výsledkoch. Veľké štúdie sú zvyčajne sponzorované farmaceutickými spoločnosťami alebo vládnymi agentúrami. Aplikácia personalizovaného lieku je spojená s individuálnymi pacientmi s účinnou liečbou založenou na modeloch v údajoch z klinických štúdií.

Tento prístup presahuje rámec uplatňovania princípov medicíny založených na dôkazoch, podľa ktorých poskytovateľ zdravotnej starostlivosti určuje, či pacient zdieľa široké spektrum (napr. Vek, pohlavie, rasa, klinický stav) s účastníkmi pokusov. S veľkou analýzou údajov je možné zvoliť liečbu založenú na omnoho podrobnejších informáciách, ako je genetický profil rakoviny pacienta (pozri nižšie).

Systémy podporujúce klinické rozhodnutia (CDSS) sa tiež rýchlo rozvíjajú a teraz predstavujú veľkú časť umelého inteligencie (AI) v medicíne.

Používajú údaje o pacientoch na pomoc lekárom pri rozhodovaní a sú často kombinované s EHR.

Genetické databázy

Úložisko ľudských genetických informácií sa naďalej hromadí rýchlo. Odkedy bol projekt ľudského genómu dokončený v roku 2003, náklady na sekvenovanie ľudských DNA sa znížili o milión. Projekt osobného genómu (PGP), ktorý sa začal v roku 2005 v Harvard Medical School, usiluje o sekvenovanie a propagáciu všetkých genómov 100 000 dobrovoľníkov z celého sveta. Samotný PGP je hlavným príkladom veľkého dátového projektu kvôli objemu a rôznorodosti dát.

Osobný genóm obsahuje približne 100 gigabajtov údajov. Okrem sekvenovania genómov PGP zhromažďuje aj údaje z EHR, prieskumov a mikrobiologických profilov.

Niekoľko spoločností ponúka na komerčnom základe priamu konzumáciu genetických sekvencií pre zdravie, osobné vlastnosti a farmakogenetiku.

Tieto osobné informácie by mohli byť podriadené veľkej analýze údajov. Napríklad od 23. novembra 2013 23 aMe prestali ponúkať genetické správy súvisiace so zdravím novým zákazníkom, aby vyhoveli americkému úradu pre potraviny a liečivá. V roku 2015 však spoločnosť opäť začala ponúkať určité zdravotné zložky svojho testu genetickej sliny, tentoraz s povolením FDA.

Verejné záznamy

Vláda vedie podrobné záznamy o udalostiach súvisiacich so zdravím, ako napríklad prisťahovalectvo, manželstvo, narodenie a smrť. Sčítanie obyvateľov USA zhromažďovalo obrovské množstvo informácií každých 10 rokov od roku 1790. Štatistická webová stránka cenzúry mala od roku 2013 370 miliárd buniek a približne 11 miliárd ďalších ročne.

Webové vyhľadávanie

Informácie o vyhľadávaní na internete získané spoločnosťou Google a inými poskytovateľmi vyhľadávania na webe by mohli poskytnúť informácie v reálnom čase týkajúce sa zdravia obyvateľstva. Hodnota veľkých údajov z modelov vyhľadávania na webe sa však môže zlepšiť kombináciou s tradičnými zdrojmi zdravotných údajov.

Sociálne médiá

Facebook, Twitter a iné platformy sociálnych médií generujú bohaté množstvo dát nepretržite a poskytujú prehľad o umiestneniach, zdravotnom správaní, emóciách a sociálnych interakciách používateľov. Aplikácia rozsiahlych údajov o sociálnych médiách na verejné zdravie sa označuje ako detekcia digitálnych ochorení alebo digitálna epidemiológia. Twitter, napríklad, bol použitý na analýzu chrípkových epidémií medzi všeobecnou populáciou.

Projekt Svetového blahobytu, ktorý sa začal na univerzite v Pensylvánii, je ďalším príkladom štúdia sociálnych médií, aby lepšie pochopili skúsenosti a zdravie ľudí. Projekt spája psychológov, štatistikov a počítačových vedcov, ktorí analyzujú jazyk použitý pri interakcii online, napríklad pri písaní aktualizácií stavu na Facebooku a Twitteru. Vedci pozorujú, ako sa jazyky používateľov týkajú ich zdravia a šťastia. Pokroky v spracovaní prírodných jazykov a strojovom vzdelávaní pomáhajú so svojím úsilím. Nedávna publikácia z Pennsylvánskej univerzity skúmala spôsoby predpovedania duševnej choroby analyzovaním sociálnych médií. Zdá sa, že príznaky depresie a iných duševných ochorení možno zistiť štúdiom nášho používania internetu. Vedci dúfajú, že v budúcnosti tieto metódy dokážu lepšie identifikovať a pomôcť rizikovým jedincom.

Internet vecí (IoT)

Veľké množstvo informácií týkajúcich sa zdravia sa zhromažďuje a ukladá aj na mobilných a domácich zariadeniach .

Smartphony : Tisíce aplikácií mHealth zachytávajú informácie o fyzickej aktivite používateľa, o príjme potravín, modeloch spánku, emóciách a ďalších parametroch. Aplikácie s natívnym mobilným telefónom (napr. GPS, e-mail, textové správy) môžu tiež poskytnúť informácie o zdravotnom stave jednotlivca.
Otrasné monitory a zariadenia: Krokomery, akcelerometre, okuliare, hodinky a čipy vložené pod kožu tiež zhromažďujú informácie týkajúce sa zdravia a môžu ich tiež poslať do oblaku.
Zariadenia telemedicíny umožňujú poskytovateľom zdravotnej starostlivosti monitorovať parametre pacienta, ako je krvný tlak, srdcová frekvencia, respiračná frekvencia, okysličenie, teplota, sledovanie EKG a hmotnosť.

Finančné transakcie

Transakcie kreditných kariet pacientov sú zahrnuté v prediktívnych modeloch používaných systémom Carolinas HealthCare na identifikáciu pacientov, ktorí sú vystavení vysokému riziku pre opätovné prijatie do nemocnice. Poskytovateľ zdravotnej starostlivosti v Charlotte využíva veľké údaje na rozdelenie pacientov do rôznych skupín, napríklad na základe chorôb a geografickej polohy.

Etické a súkromné dôsledky

Treba zdôrazniť, že v niektorých prípadoch môžu mať dôležité etické a súkromné dôsledky pri zhromažďovaní a sprístupňovaní údajov v zdravotnej starostlivosti. Nové zdroje veľkých údajov môžu zlepšiť naše pochopenie toho, čo ovplyvňuje zdravie jednotlivcov a obyvateľov, avšak rôzne riziká je potrebné dôkladne zvážiť a monitorovať. Teraz bolo tiež zistené, že údaje, ktoré sa predtým považovali za anonymné, môžu byť opätovne identifikované. Napríklad profesor Latanya Sweeney z laboratória Data Privacy Lab v Harvarde prehodnotil 1130 dobrovoľníkov zapojených do projektu osobného genómu. Ona a jej tím dokázali správne pomenovať 42 percent účastníkov na základe informácií, ktoré zdieľali (PSČ, dátum narodenia, pohlavie). Tieto vedomosti môžu zvýšiť naše vedomie o potenciálnych rizikách a pomôcť nám pri rozhodovaní o zdieľaní údajov.

> Zdroje:

> Conway M, O'Connor D. Sociálne médiá, veľké údaje a duševné zdravie: súčasné pokroky a etické dôsledky. Súčasné stanovisko v psychológii 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Veľké údaje, väčšie výsledky. Journal of the American Health Information Management Association , 83 (10): 38-43

> Guntuku S, Yaden D, Kern M., Ungar L, Eichstaedt J. Detekcia depresie a duševných ochorení na sociálnych médiách: integračný prehľad . Current Opinion in Behavioral Sciences 2017; 18: 43-49.

> Lazer D, Kennedy R, Kráľ G, Vespignani A. Podobenstvo o Chrípke Google: Trapky vo veľkej analýze údajov . Science 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Veľká analýza dát v zdravotníctve: sľub a potenciál. Zdravotnícka informatika a systémy 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identifikácia účastníkov projektu osobného genómu podľa mena . Harvardská univerzita. Laboratórium ochrany osobných údajov. Biela kniha 1021-1. 24. apríla 2013.