Haavanhoidon standardointi tekoälypohjaisella kuvantunnistusohjelmalla
URN:
Tiivistelmä
Krooniset haavat ovat merkittävä terveydenhuollon haaste sekä potilaiden elämänlaadun että kustannusten näkökulmasta. Väestön ikääntyminen sekä diabeteksen ja lihavuuden lisääntyminen kasvattavat haavanhoidon tarvetta entisestään. Haavanhoidon onnistuminen edellyttää oikea-aikaista ja asiantuntevaa arviointia, mutta käytännön työssä haavakudosten tunnistaminen ja hoitotuotteiden valinta vaihtelevat huomattavasti haavanhoitoon osallistuvien ammattilaisten välillä. Tämä voi johtaa haavojen kroonistumiseen, virheellisiin hoitoratkaisuihin ja lisääntyneisiin kustannuksiin.
Artikkelissa kuvataan tekoälypohjaisen kuvantunnistusohjelman kehittämistä kroonisten haavojen arvioinnin tueksi. Tavoitteena oli luoda neliluokkainen haavapohjan väriluokittelumalli, joka tunnistaa haavan hallitsevan kudostyypin kliinisistä valokuvista: musta (nekroosi), keltainen (kate/fibriini), punainen (granulaatiokudos) ja vaaleanpunainen (epitelisaatio). Malli perustui syväoppimiseen ja SE-ResNeXt50-konvoluutioneuroverkkoon.
Tutkimusaineisto koostui 813 haavakuvasta, jotka kerättiin Satasairaalan haavakeskuksesta vuosina 2020–2025. Kuville annettiin hallitseva väriluokka kokeneen haavanhoitajan toimesta. Mallin suorituskykyä arvioitiin erillisellä testiaineistolla sekä kliinisellä asiantuntijapaneelilla, jossa kolme haavanhoidon ammattilaista arvioi 52 kuvaa.
Tulosten perusteella mallin kokonaistarkkuus oli 81,6 % ja tasapainotettu tarkkuus 75,3 %. Asiantuntijapaneelissa tekoälyn ja kliinikoiden välinen yhtenevyys oli hyvä, erityisesti selkeissä kudostyypeissä.
Johdanto
Kroonisen haavan määritelmänä on haava, jonka paraneminen ei etene normaalin vaiheittaisen aikataulun mukaisesti pysyvään paranemiseen, ja on ollut avoinna yli neljä viikkoa (Frykberg). Kroonisista haavoista suurimman ryhmän muodostavat verisuoniperäiset haavat (laskimo- ja/tai valtimoverenkierron vajaatoiminta), diabeettiset haavat ja painehaavat. (Ahmajärvi) Haavanhoito aiheuttaa merkittävän kustannuserän hyvinvointialueille: eurooppalaisten tutkimusten mukaan kroonisten haavojen hoitokustannukset ovat 3–5 % terveydenhuollon kokonaismenoista (Posnett, Phillips, Korhonen). Suurimmat haavanhoidon kustannukset aiheutuvat sairaalajaksoista, poliklinikkakäynneistä ja kotihoidon käynneistä. (Khoo, Guest, Lindholm, Krooninen alaraajahaava). Väestön ikääntymisen sekä diabeteksen ja lihavuuden yleistymisen myötä haavanhoitokulujen oletetaan suurenevan entisestään.
Haavan paranemisen todennäköisyys vähenee haavan kroonistuessa, joten hoito on aloitettava tehokkaasti heti haavan ilmaannuttua. Haavan paikallishoidon tavoitteena on edistää haavan paranemista luomalla suotuisa paranemisympäristö ja puhdistaa haava. Haavojen paikallishoidossa vaaditaan ymmärrystä kudostyypeistä ja kudosten vitaliteetin arvioinnista. Tätä varten suunnitteilla on haavakuvasta tehtävään haavatyypin tunnistukseen perustuva tekoäly. Kuvantunnistustekoälyä on käytetty lääketieteessä jo paljon, etenkin radiologian alalla. Myös haavojen tunnistukseen liittyviä julkaisuja on viime vuosina ilmaantunut enenevässä määrin, etenkin teknologisen kirjallisuuden joukossa (Alaraajojen tukkiva valtimotauti, Ramachandram, Shah). Lääketieteellisiä julkaisuja haavojen tekoälypohjaisen kuvantunnistusohjelman käytöstä on vielä melko vähän.
Krooniset ja vaikeasti paranevat haavat edellyttävät haavanhoitoa usein 2–3 kertaa, mutta toisinaan jopa 5–7 kertaa viikossa kotisairaalan, kotihoidon tai terveyskeskuksen toimesta. Hoitohenkilökunnan tehtäviin kuuluvat mm. kuolleen kudoksen poisto, infektion ja tulehduksen hallinta, kosteustasapainon ylläpito sekä hoidon tehostamisen arviointi. Keskeinen haavanhoidon työkalu on haavapohjan väriperusteinen kuvaus kudostyyppien mittarina: musta (nekroottinen kuolio/eschar), keltainen (kate/fibriini), punainen (granulaatiokudos) ja vaaleanpunainen (epitelisoituva kudos). Näiden tunnistaminen ja arviointi kuitenkin vaihtelevat asiantuntijoiden välillä. Lisäksi haavanhoitotuotteiden valinta aiheuttaa usein haasteita etenkin haavanhoitoon perehtymättömän henkilökunnan keskuudessa. Haavanhoitotuotteissa on myös suurta hintavaihtelua, ja oikein valituilla taloudellisilla haavanhoitotuotteilla voidaan saavuttaa merkittävät säästöt. Asiantuntematon haavanhoito tuottaa lisäkuluja silloin, kun haava kroonistuu tai kroonista haavaa hoidetaan liian pitkään väärin ilman konsultaatiota tai kun tehdään vääriä toimenpiteitä tai valitaan liian kalliita ja vääriä haavanhoitotuotteita. Tämän hankkeen tavoite on pyrkiä vastaamaan näihin haasteisiin.
Tekoälypohjainen kuvantunnistusohjelma
Tässä artikkelissa kuvataan käyttöönottoon soveltuva työnkulku neliluokkaiseen haavapohjan väriluokitteluun (musta, keltainen, punainen, vaaleanpunainen) tavanomaisista kliinisistä valokuvista. Arviointi on suunniteltu heijastamaan realistista yleistettävyyttä käyttämällä potilastason aineistonjakoa sekä luokkatasapainon huomioivaa mallinvalintaa (Yagis ym. 2021; Huang ym. 2023). Perinteisiä luokittelumittareita täydennetään pehmeällä vertailulla mallin tuottamien todennäköisyyksien (soft comparison between model probability) ja kliinikoista koostuvan asiantuntijapaneelitestin avulla. Tämä mahdollistaa sekamuotoisten haavakudostyyppien arvioinnin yksittäisen ensisijaisen luokan lisäksi. Menetelmä vastaa myös sitä, miten kliinikot käytännössä arvioivat kudoskoostumusta. Kirjallisuuden mukaan asiantuntijoidenkin välillä on erimielisyyttä etenkin epitelisaation (vaaleanpunainen) tunnistamisessa (Mohammed ym. 2025).
Kirjallisuuskatsaus
Kliiniset viitekehykset, kuten Wound Bed Preparation (WBP) ja TIME-malli, on kehitetty systematisoimaan haavojen arviointia yhdistämällä havaittavat haavapohjan löydökset hoidollisesti merkityksellisiin tavoitteisiin (Schultz ym. 2003; Schultz ym. 2005). Näissä viitekehyksissä kudoksen ulkonäköä pidetään hoitopäätösten kannalta merkityksellisenä signaalina, ja väriä käytetään usein helposti arvioitavana kudostilan epäsuorana mittarina rutiininomaisessa seurannassa (Schultz ym. 2005).
Kudoksen visuaalinen arviointi on kuitenkin subjektiivista. Kliinikoiden välinen yhtenevyys on raportoitu kohtalaiseksi tai heikoksi erityisesti epitelisaation arvioinnissa, vaikka arvioijilla olisi kokemusta, kun taas nekroosin ja katteen osalta yhtenevyys on ollut parempi niiden selkeämmän ulkonäön vuoksi (Mohammed ym. 2025). Tämä vaihtelu korostaa päätöksenteon tukityökalujen tarvetta, jotta dokumentointiin ja viestintään saataisiin yhdenmukainen viitepiste.
Kuvapohjaisen tekoälyn käyttö haavojen arvioinnissa on lisääntynyt nopeasti, ja viimeaikaisissa systemaattisissa katsauksissa on tarkasteltu sovelluksia, jotka kattavat kudosten luokittelun ja kvantifioinnin, haavan mittaamisen, segmentoinnin, etiologisen luokittelun sekä paranemisen ennustamisen (Anisuzzaman ym. 2022; Reifs Jimenez ym. 2025). Näissä katsauksissa on toistuvasti tuotu esiin haasteita luokittelumerkintöjen luotettavuudessa, aineistojen monimuotoisuudessa ja ulkoisessa validoinnissa, mikä yhdessä rajoittaa mallien yleistettävyyttä.
Segmentointiin perustuvia menetelmiä on tutkittu kudoskoostumuksen arvioimiseksi, ja konvoluutioneuroverkkoihin (CNN) perustuvan kudossegmentoinnin on osoitettu toimivan kliinisesti merkityksellisten haavapohjakudostyyppien tunnistamisessa painehaavoissa (Zahia ym. 2018). Myös haavan paikannusta ja segmentointia on toteutettu ensisijaisesti kiinnostavan alueen rajaamiseksi taustan aiheuttamien virhepäätelmien vähentämiseksi sekä mallien kestävyyden parantamiseksi todellisissa kuvausolosuhteissa (deep CNN pipelines), (Wang ym. 2020; Scebba ym. 2022). Tässä työssä painopiste on kuitenkin ollut kevyessä luokittelutavassa, jonka tavoitteena on tuottaa kuvaus hallitsevasta haavapohjan kudostyypistä mahdollisimman vähäisellä annotointityöllä. Segmentointiin perustuva kvantifiointi nähdään kuitenkin suorana jatkokehitysaskeleena, koska sen avulla voidaan tuottaa kliinisesti tulkittavia arvioita sekamuotoisista kudosfenotyypeistä sekä mahdollistaa muutosten tarkempi seuranta ajan kuluessa.
Luokittelumenetelmiä on kehitetty myös korkeamman tason haavaominaisuuksien, kuten infektiotilan ja etiologian, arviointiin. Esimerkiksi monitehtäväisiä syväoppimismalleja on käytetty useiden haavaominaisuuksien luokitteluun värikuvista, ja niiden suorituskykyä on verrattu kliinikoiden arvioihin yhtenevyysmittareiden avulla (Huang ym. 2023). Ulkonäköön perustuvissa tehtävissä liian optimistisen arvioinnin riski on huomattava silloin, kun samalta potilaalta on useita seurantakäyntejä, minkä vuoksi potilaskohtainen aineistonjako on keskeinen metodologinen vaatimus (Yagis ym. 2021; Reifs Jimenez ym. 2025).
Mallinnuksen näkökulmasta siirto-oppimista nykyaikaisilla konvoluutioneuroverkkoarkkitehtuureilla on hyödynnetty laajasti suurten esikoulutettujen aineistojen tarjoaman tiedon hyödyntämiseksi. Aggregoituihin residuaalimuunnoksiin (ResNeXt) ja kanavahuomiomekanismeihin (Squeeze-and-Excitation) perustuvien arkkitehtuurien on raportoitu parantavan mallien representointikykyä ja ominaisuuksien uudelleenkalibrointia. Tämän vuoksi niitä on pidetty soveltuvina vaihtoehtoina hienovaraisen ulkonäköerottelun tehtäviin rajallisissa lääketieteellisissä aineistoissa (Xie ym. 2017; Hu ym. 2018).
Menetelmät
Tutkimusasetelma ja tehtävä
Työssä kehitettiin ohjattuun oppimiseen perustuva kuvaluokittelun työnkulku neljälle haavapohjan väriluokalle (Kuva 1): musta (nekroottinen kuolio/eschar), keltainen (kate/fibriini), vaaleanpunainen (epitelisoituva) ja punainen (granuloiva). Kuvantunnistusohjelma on haavan kudostyyppiä kuvaava työkalu, ei diagnostinen väline.

Aineiston lähde ja valintakriteerit
Kuvat kerättiin Satasairaalan haavakeskukselta Suomessa vuosina 2020–2025 osana rutiinihoitoa. Kuvaukseen käytettiin digitaali- tai älypuhelinkameroita standardoiduissa olosuhteissa (riittävä valaistus, pystysuora asento ja rajaamaton kuva). Sisäänottokriteereinä olivat hyvä suora valaistus, haavan täydellinen näkyvyys, heijastamaton haavapohja, sopiva kuvausetäisyys ja selkeä värintoisto. Poissulkukriteereihin kuuluivat huono tarkennus, paljaat kädet haavan lähellä, tatuoinnit, kasvot tai muut tunnistettavat piirteet, kaksoiskappaleet sekä kuolleet potilaat.
Merkintä, luokkajakauma ja esikäsittely
Haavanhoidon ammattilainen (kokenut auktorisoitu haavanhoitaja) antoi jokaiselle haavakuvalle yhden hallitsevan väriluokan. Aineistossa oli 813 kuvaa: keltaisia 436, mustia 160, punaisia 154 ja vaaleanpunaisia 63. Kuvat rajattiin haava-alueelle ja muutettiin yhtenevään kokoon (224 × 224 pikseliä).
Malli ja koulutus
Mallina (convolutional neural network) käytettiin SE-ResNeXt50 (32 × 4d) -runkoa ImageNet-alustuksella. Koulutuksessa käytettiin seuraavia suureita: oppimisnopeus 1×10⁻³, weight decay 1×10⁻⁷, dropout-arvo 0.5, ja eräkoko 16.
Validointi ja tekninen arviointi

Stratifioidulla 80/20-jaolla haavakuvista eroteltiin osa kehitystehtävään (model development n=650) ja erillinen testijoukko (test set n=163). Jako tehtiin satunnaistetusti ennen mallin koulutusta. Kehitysjoukon sisällä käytettiin viisiosaista stratifioitua ristiinvalidointia. Malli valittiin parhaan tasapainotetun validointitarkkuuden perusteella. Lopullisina testimittareina käytettiin tarkkuutta, tasapainotettua tarkkuutta ja ristiintaulukointia (confusion matrix). (Taulukko 1)
Kliininen asiantuntijapaneeli

Erillinen 52 kuvan aineisto, jota ei käytetty kehitys- tai testausvaiheessa, arvioitiin kolmen haavanhoidon ammattilaisen (yksi kokenut plastiikkakirurgian erikoislääkäri, yksi kokenut auktorisoitu haavanhoitaja, yksi plastiikkakirurgiaan erikoistuva lääkäri) paneelissa. Jokaisesta kuvasta paneeli kirjasi neljän värin konsensusprosenttijakauman, ja malli tuotti vastaavat todennäköisyysvektorit. (Taulukko 2)
Vertailu tehtiin kahdella tavalla:
- Kova yhtenevyys: kliinikon hallitseva väriluokka verrattuna mallin todennäköisimpään ennusteeseen; yhteenvetona tarkkuus, tasapainotettu tarkkuus ja sekaannusmatriisi.
- Pehmeä yhtenevyys: kliinikon prosenttijakauman ja mallin todennäköisyyksien välinen keskimääräinen absoluuttinen ero prosenttiyksikköinä.
Tulokset
- Tekninen suorituskyky testijoukossa (n=163)
- Kokonaistarkkuus oli 81,6 % (133/163) ja tasapainotettu tarkkuus 75,3 %. Luokkakohtainen yhtenevyys oli seuraava: musta 100,0 % (32/32), keltainen 86,2 % (75/87), punainen 61,3 % (19/31) ja vaaleanpunainen 53,8 % (7/13).
- Kliinikon ja tekoälyn välinen paneelivertailu (n=52)
- Hallitsevan värin yhtenevyys oli 75,0 % (39/52) ja tasapainotettu tarkkuus 0,743. Luokkakohtainen yhtenevyys oli seuraava: musta 91,7 % (11/12), keltainen 76,5 % (13/17), vaaleanpunainen 66,7 % (10/15) ja punainen 62,5 % (5/8).
Johtopäätökset
Neliluokkainen haavapohjan kudostyypin luokittelu onnistui mallilta parhaiten mustan ja keltaisen kudostilan tunnistuksessa, mutta heikompaa suorituskykyä esiintyi punaisen ja vaaleanpunaisen kohdalla. Tämä heijastaa yleistä haastetta granulaatiokudoksen ja epitelisaation luokittelun välillä (Ramachandram). Asiantuntijapaneelissa mallin tulokset vastasivat hyvin asiantuntija-arvioita, ja suurin osa eroista liittyi rajatapauksiin tai sellaisiin haavakuviin, jotka eivät olleet yksiselitteisiä. Löydökset tukevat tekoälyn käyttöä päätöksenteon tukena, ei itsenäisenä ratkaisijana (Mohammed et al).
Jotta menetelmä voitaisiin ottaa käyttöön osana rutiininomaista haavanhoitoa, tarvitaan lisää aineistoa, selkeämpiä luokittelumääritelmiä sekä ulkoista validointia erilaisissa kuvausolosuhteissa. Tämä on linjassa tuoreissa katsauksissa raportoitujen yleisten rajoitteiden kanssa (Anisuzzaman ym. 2022; Reifs Jimenez ym. 2025). Tulevassa tutkimuksessa suunnitellaan haavan paikannusta/segmentointia ja luokittelujärjestelmän laajentamista kattamaan neljän väriluokan lisäksi muitakin kliinisesti merkityksellisiä kudostyyppejä sekä ympäröivää ihoa (Wang ym. 2020; Scebba ym. 2022; Rathore ym. 2025).
Mitra Daneshmand
TM, vanhempi lehtori ja tutkija, 0009-0000-7431-190X, Ihmisen toimintakyvyn tutkimuskeskus
Heli Björlin
Auktorisoitu haavahoitaja, kirurgian osasto ja haavakeskus, 0009-0004-6400-4753, Satasairaala
Ira H. Saarinen
LT, plastiikkakirurgian erikoislääkäri, kirurgian osasto ja haavakeskus, 0000-0001-8631-2897, Satasairaala, Turun yliopisto
Mitra Daneshmand, Heli Björlin ja Ira H. Saarinen työskentelevät HyvoData-hankkeessa (Ihmisen toimintakyvyn tutkimuskeskus) kehittäen haavahoitoon tekoälypohjaista kuvantunnistusohjelmaa.
Artikkeli on kirjoitettu osana Hyvinvointialueen data tehokäyttöön (HyvoData) -hanketta, joka on Euroopan unionin osarahoittama. HyvoData-hankkeen tavoitteena on vahvistaa tekoälyn ja data-analytiikan hyödyntämistä palveluissa, kehittää älykkäitä ratkaisuja saavutettavuuden ja ennakoivien palvelujen tueksi sekä osoittaa, että Satakunnan hyvinvointialueen ja SAMKin yhteistyö tuottaa konkreettisia hyötyjä väestön hyvinvoinnille ja taloudelle.