Terveystietojen tietolupahakemusten ABC – kokemuksia terveystietoja hyödyntävän tutkimuksen suunnittelusta

Hammashoitohuone, jossa suojavaatteisiin pukeutunut työntekijä istuu hoitotuolin vieressä.
Kuvituskuva, Pexels.

Tiivistelmä

Kansalaisten terveystietojen eri rekistereihin keräämisen ensisijainen tarkoitus on esimerkiksi terveydenhuollossa mahdollistaa potilaan turvallinen hoito ja turvata jatkohoito. Näiden rekisteritietojen toissijaisella käytöllä taas tarkoitetaan erityisesti tutkimuskäyttöä. Suomessa terveys- ja sosiaalitietojen toissijaisesta käytöstä on säädetty niin kutsuttu toisiolaki, jonka tarkoitus on turvata asiakkaiden tietosuojaoikeudet samalla, kun rekisteriaineistoja hyödynnetään tehokkaasti. Findata on lupapalveluviranomainen, josta haetaan lupa rekisteritietojen käyttöön usealta eri rekisterinpitäjältä. Findata myös kokoaa ja yhdistelee aineistot eri rekisterinpitäjiltä ja toimittaa ne tutkimuskäyttöön. Tietolupahakemukseen tarvitaan tarkkaan mietitty tutkimussuunnitelma, rekisterinpitäjälle tietojen poimintakuvaus sekä tutkimuksen vaikutuksenarviointi. Lisäksi aineistoa on käsiteltävä tietoturvallisessa analysointiympäristössä. Vaikka rekisteröityjen tietosuojaoikeudet on tärkeä ottaa huomioon, toisiolaki on tehnyt rekisteritutkimusten tekemisestä myös hitaampaa ja jäykempää. Tutkimuksen alkuvaiheeseen on varattava resursseja tutkimusaineistojen hankintaan, ja varauduttava pitkiin käsittelyaikoihin ja toimitusmaksuihin.

Mikä on toisiolaki ja millaisia tietoja se koskee

Joka kerta, kun potilas käyttää terveydenhuollon palveluja, hänestä tallennetaan tietoja potilastietojärjestelmiin. Vastaavasti sosiaalihuollossa asiakkaasta kertyy rekisteritietoja silloin, kun hän saa palveluja, tai kun kansalainen hakee etuuksia Kelasta. Näiden tietojen tallentamisen ensisijainen tehtävä on tietenkin terveydenhuollossa varmistaa potilaan turvallinen, asianmukainen hoito ja turvata jatkohoito sekä sosiaalihuollossa mahdollistaa etuuksien ja palvelujen lakisääteinen käsittely. Samalla huolehditaan rekisteröityjen tietosuojaoikeuksien toteutumisesta.

Rekisteritietojen toissijaisesta käytöstä puhutaan silloin, kun niitä hyödynnetään tieteellisessä tutkimuksessa, tilastotiedon laatimisessa, kehitys- ja innovaatiotoiminnassa, opetuksessa sekä viranomaiskäytössä, esimerkiksi suunnittelussa ja raportoinnissa. Suomessa terveys- ja sosiaalitietojen toissijaisesta käytöstä on säädetty erillinen laki, niin kutsuttu toisiolaki (Laki terveys- ja sosiaalitietojen toissijaisesta käytöstä, 26.4.2019/552). Lakia sovelletaan aina, kun terveys- ja sosiaalialan tietoja on ensin kerätty ja tallennettu rekisteriin ja kun näitä tietoja halutaan käyttää johonkin edellä mainittuun toiseen tarkoitukseen.

Toisiolain alaisia aineistoja ovat sosiaali- ja terveysalan rekisteriaineistot, jotka sisältävät henkilötietoja. Henkilötietoja ovat suorien tunnistetietojen, kuten nimen, osoitteen ja henkilötunnuksen lisäksi kaikki tunnistettuun tai tunnistettavissa olevaan luonnolliseen henkilöön liittyviä tietoja (Tutkimuseettinen neuvottelukunta, 2019). Myös pseudonyymit tutkimusaineistot sisältävät henkilötietoja, sillä vaikka suorat tunnistetiedot on poistettu ja korvattu havaintotunnuksilla, tietojen pseudonymisoineella taholla on tallessa koodiavain, jolla pseudonymisointi voidaan purkaa ja yhdistää tiedot tunnistettaviin henkilöihin (Tietosuojavaltuutetun toimisto, 2021). Lisäksi joissain tapauksissa henkilö voidaan pseudonymisoinnista huolimatta edelleen tunnistaa epäsuorasti. Esimerkiksi pienellä paikkakunnalla asuva, harvinaista sairautta sairastava henkilö voi olla tunnistettavissa ilman suoria tunnistetietojakin.

Toisiolaki ei koske aggregoitua tilastotietoa, jossa yksittäisten ihmisten tietoja on yhdistetty tai summattu koskemaan henkilöryhmiä. Tällöin yksittäisiä henkilöitä ei pysty enää tunnistamaan, eli tiedot ovat anonyymejä. Esimerkki tällaisesta tilastotiedosta voisi olla päivittäin tupakoivien lukumäärät aggregoituna eli laskettuna yhteen kunnittain, sukupuolittain ja ikäryhmittäin. Lukumääristä ei voi tunnistaa yksittäisen henkilön tupakointitottumuksia, eivätkä ne siten ole henkilötietoja. Tilastotietoja on saatavissa varsin vapaasti esimerkiksi Tilastokeskukselta tai Terveyden ja hyvinvoinnin laitoksen ylläpitämästä Sotkanetistä (sotkanet.fi).

Tässä kirjoituksessa tarkastelemme toisiolain alaisten rekisteriaineistojen hakemista tutkimuskäyttöön. Tavoitteena on selventää keskeisiä käsitteitä ja kuvata lupaprosessiin liittyviä käytäntöjä kokemustemme pohjalta. Havaintomme perustuvat työskentelyymme SAMKin HyvoData-hankkeessa, jonka tarkoituksena on saada Satakunnan hyvinvointialueen aineistot hyötykäyttöön.

Rekisteritietojen tietolupaprosessi

Toisiolaki tuli voimaan 1.5.2019. Sitä ennen tietolupaa, eli lupaa käsitellä salassa pidettäviä henkilötietoja, oli haettava erikseen jokaiselta rekisterinpitäjältä, eikä aineistojen toimittamiselle ollut yhtenäisiä käytäntöjä. Lain voimaantulon myötä lupakäytäntöjä ryhdyttiin yhdenmukaistamaan, ja lupaprosessia varten perustettiin erillinen keskitetty viranomainen. Findata on sosiaali- ja terveysalan lupapalveluviranomainen, jonka tehtävä on paitsi myöntää käyttölupia toisiolain alaisiin rekisteriaineistoihin, myös vastata aineistojen toimittamisesta tutkimuskäyttöön. Käytännössä Findata kokoaa ja yhdistelee aineistot eri rekisteripitäjiltä sekä huolehtii niiden pseudonymisoinnista tai anonymisoinnista tietosuojan varmistamiseksi. Lisäksi Findata tarjoaa tutkimuskäyttöön useamman rekisterinpitäjän tiedoista valmiiksi koottuja valmisaineistoja.

Findata myöntää luvat sosiaali- ja terveystietojen toissijaiseen käyttöön, kun niitä tarvitaan usealta julkiselta rekisterinpitäjältä, yksityiseltä sektorilta tai Kanta-palveluista. Myös jotkut yksittäiset rekisterinpitäjät ovat siirtäneet oman lupatoimivaltansa Findatalle. Esimerkiksi, jos hakee tutkimusaineistoa vain Satakunnan hyvinvointialueen potilastietojärjestelmästä, luvan siihen myöntää hyvinvointialue itse. Jos taas potilastietojärjestelmän tietoihin yhdistetään muita rekisteritietoja esimerkiksi Tilastokeskuksesta, Eläketurvakeskuksesta tai Digi- ja Väestötietovirastosta, luvan tähän myöntää Findata.

Tietolupaa hakiessa tutkijalla täytyy olla jo tarkka näkemys tutkimuksen tarkoituksesta ja tavoitteista, tarvittavista tiedoista ja niiden hyödyntämismenetelmistä. Tätä varten kirjoitetaan tutkimussuunnitelma, josta ilmenevät lupahakemuksella haettavien tietojen käyttötarkoitus, niiden rekisterinpitäjä ja käsittelijät, käsittelyn oikeudellinen peruste sekä tietojen käsittelyn tietosuojaan ja tietoturvaan liittyvät olennaiset seikat. Huomioon on otettava myös EU:n yleisen tietosuoja-asetuksen mukainen minimointiperiaate, jonka perusteella lupa voidaan myöntää vain sellaisten tietojen käyttöön, joille on selkeä ja perusteltu tarve (EU GDPR, 2016/679). Tutkimussuunnitelma auttaa lupaviranomaista arvioimaan pyydettyjen tietojen tarpeellisuutta tutkimukselle. Jos jonkin pyydetyn tiedon käyttötarkoitus ei selviä suunnitelmasta, sen tarpeellisuutta ei voida arvioida eikä tietolupaa niille tiedoille tulisi myöntää.

Tietojen poimintakuvaus tarvitaan rekisterinpitäjälle kertomaan, millaista tietoa laajasta rekisteristä halutaan poimia. Siihen kirjataan tarvittavien tietojen rajaus, esimerkiksi ajallinen rajaus tai rajaus jonkun kohdejoukon ominaisuuden, kuten iän tai asuinpaikan perusteella. Poimintakuvausta tehdessä kannattaa olla mahdollisimman tarkka ja perusteellinen, jolloin aineiston rakenne hahmottuu myös tutkijalle itselleen. Findatalle poimintakuvauksen tekemisessä ja aineistojen kartoituksessa auttaa Aineistokatalogi (aineistokatalogi.fi), jossa saatavilla olevia aineistokokonaisuuksia on dokumentoitu: mitä eri rekisterinpitäjiä on olemassa, millaisia aineistokokonaisuuksia on saatavilla ja vielä tarkemmin, mitä muuttujia nämä kokonaisuudet sisältävät, miltä ajalta tietoja on saatavissa ja mikä on tietojen kohdejoukko.

Rekisteritutkimuksen eettisyyden arviointi

Puhtaissa rekisteritutkimuksissa henkilötietojen käsittely perustuu viranomaislupaan, sillä tutkimushenkilöiltä itseltään ei käytännössä ole mahdollista pyytää suostumusta tutkimukseen osallistumiseen. Tästä syystä henkilötietojen käsittelyyn liittyviä riskejä on arvioitava huolellisesti. Tätä varten laaditaan vaikutustenarviointi (DPIA, Data Protection Impact Assessment), joka tarvitaan yleensä silloin, kun suunnitellaan henkilötietojen käsittelyä (Tietosuojavaltuutetun toimisto, 2021). Vaikutustenarvioinnissa kuvataan, miten henkilötietoja tutkimuksessa käsitellään, arvioidaan käsittelyn tarpeellisuutta ja siihen liittyviä riskejä sekä määritellään toimenpiteet, joilla tunnistettuihin riskeihin puututaan.

Tutkimuksen eettisessä ennakkoarvioinnissa tarkastellaan ja ennakoidaan tutkittaville koituvia mahdollisia haittoja etiikan näkökulmasta. Se on tehtävä aina lääketieteellisen tutkimuksen yhteydessä (Laki lääketieteellisestä tutkimuksesta, 488/1999). Rekisteritutkimuksien yhteydessä eettistä ennakkoarviointia ei kuitenkaan ole tarpeen tehdä (Räisänen ja Gissler, 2012). Lisätietoa eettisen arvioinnin tarpeesta löytyy Tutkimuseettisen neuvottelukunnan ohjeesta (Tutkimuseettinen neuvottelukunta, 2019).

Tietoturvalliset käyttöympäristöt

Toisiolaki määrittää myös puitteet tutkimusaineiston käsittelyyn. Käytännössä tämä tarkoittaa sitä, että tutkija ei saa toisiolain alaista aineistoa rekisterinpitäjältä tai Findatalta mihin tahansa tallennuspaikkaan, vaan se siirretään tietoturvallista reittiä suojattuun käyttöympäristöön. Käyttöympäristön tietoturva ja tietosuoja pitää olla tarkastettu ja lain mukainen. Lupa- ja valvontavirasto (entinen Valvira) pitää yllä rekisteriä, jossa tällaiset rekisteröidyt käyttöympäristöt on listattu (astori.lvv.fi). Findata tarjoaa omaa Kapseli-palveluaan, jonka saa käyttöön hinnaston mukaisesti. Korkeakouluilla on kuitenkin käytettävissä ilmainen CSC – Tieteen tietotekniikan keskuksen SD Desktop, joka on tarkoitettu juuri toisiolain alaisen tiedon käsittelyyn.

Lopuksi: järjestelmän hienoudet ja heikkoudet

Yhden lupaviranomaisen järjestelmässä on hyvät ja huonot puolensa. Toisaalta on hyvä, viranomaiset valvovat arkaluontoisten tietojen käyttöä. Varovaisuus henkilötietojen suojelussa voi kuitenkin kääntyä itseään vastaan. Toisiolain tultua voimaan tutkijat ovat havainneet tietolupaprosessien muuttuneen jäykiksi, ja rekisteritietoja hyödyntäviä tutkimushankkeita on sen myötä jopa jouduttu lopettamaan (Lääkärilehti, 2025). Syyt ovat järjestelmän kalleudessa, hitaudessa ja hankaluudessa. Erilaisiin käsittely- ja toimitusmaksuihin menee nyt isompi osa tutkimusrahoituksesta kuin aiemmin (Lääkärilehti, 2025). Luvanhakijan on syytä varautua pitkiin käsittelyaikoihin, ja aineistonhakuprosessit onkin syytä laittaa liikkeelle hyvissä ajoin. Lisäksi yhden luukun periaate ei aina toteudu, ja esimerkiksi kustannusarviota voi joutua tiedustelemaan rekisterinpitäjältä, vaikka käyttöluvan myöntäisikin lopulta Findata.

Nykyisen järjestelmän synnyttämät ongelmat on tiedostettu, ja vireillä onkin toisiolain uudistus, lupahakemusten käsittelyn sujuvoittamiseksi. Tarkoitus on ainakin tehdä maksuista selkeämpiä ja läpinäkyvämpiä, sekä lisätä joustavuutta tietolupien käsittelyyn (Valtioneuvosto, 2025).

Terveysaineistojen hyödyntämisen, kuten kaiken tieteellisen tutkimuksen, tarkoitus on lopulta tuottaa täsmällistä ja perusteltua tietoa, joka hyödyttää koko yhteiskuntaa. Terveystietojen hyödyntämisen tapauksessa tämä voi tarkoittaa hoidon parantumista ja tehostumista tai terveydenhuollon säästöjä. Suomessa on kansainvälisesti laadukkaita rekisteriaineistoja, jotka tarjoavat erinomaiset edellytykset luotettavan tutkimustiedon tuottamiselle. Onkin kaikkien, ei ainoastaan tutkijoiden, etu, että rekisterien tutkimuskäyttö voi jatkua ja että niiden avulla onnistutaan tuottamaan päätöksenteon tueksi luotettavaa ja hyvin perusteltua tietoa.

 

Vilja Koski
Tutkija, 0000-0002-5970-3582, Tiedolla johtamisen keskus

Kirjoittaja on tilastotieteilijä, joka soveltaa tilastollisen mallintamisen menetelmiä päätöksenteon tueksi. Työskentelee data-analyytikkona HyvoData-hankkeessa.

Lähteet

Lisätietoja aiheeseen liittyen

Euroopan Unionin osarahoittama logo.

Artikkeli on kirjoitettu osana Hyvinvointialueen data tehokäyttöön (HyvoData) -hanketta, joka on Euroopan unionin osarahoittama.

Jaa artikkeli

Tulostusnappi

Lisää aiheesta

Lue myös