Suomessa tutkitaan mahdollisuutta käyttää koneoppimismenetelmää tulvien ennustamisessa – alustavat tulokset lupaavia

Suomessa tutkitaan mahdollisuutta käyttää koneoppimismenetelmää tulvien ennustamisessa. Koneoppimismenetelmää on koulutettu suurella datajoukolla seitsemällä koealueella.

Uutta koneoppimismenetelmää on koulutettu suurella datajoukolla seitsemällä koealueella Aurajoen, Karjaanjoen ja Kuivajoen vesistöissä. Koealueiden valuma-alueiden koko vaihtelee 500:n ja 2000:n neliökilometrin välillä. Myös koealueiden maankäytön jakautuminen ja lumisuus vaihtelevat. Tutkimuksessa käytettiin useita malleja. Mallien lähtötietoina olivat vedenkorkeus- ja säähavainnot.

Koneelle opetetut mallit perustuvat tuttuihin polynomifunktioihin. Mallien väliset erot ovat keskimäärin vähäisiä. Suuria eroja aiheutuu lähinnä käytetystä mallinnusmenetelmästä, lähtötietojen ja alueiden valinnasta, mallien parametrisoinnista sekä muistista. Tutkimuksessa koneoppimismenetelmä antoi tarkkoja tuloksia. Yhden vuorokauden ennusteissa korrelaatiokertoimet olivat yli 0,9.

Haasteitakin on. Etenkin kevättulvia ennustettaessa mallin olisi hyvä muistaa millainen oli edeltävä talvi. Muisti onkin tärkeä osa mallinnusta. Yleensä parempiin tuloksiin päästään, kun tallennetaan muistiin aiemmat seitsemän päivää eikä vain yhtä päivää. Kesätulvien kohdalla pitkäkestoisesta muistista voi tosin olla haittaakin, sillä kesällä rankkasateet syntyvät tunneissa. Vaatiikin vielä lisätutkimuksia, että voitaisiin arvioida, miten vanhoja tietoja mallin kannattaa milloinkin muistaa.

Alustavat tulokset ovat kuitenkin lupaavia ja ne julkaistaan vuoden lopulla artikkelina tieteellisessä sarjassa ja Vesitalous-lehdessä sekä Hydro-RDI-Network webinaarissa.

Alkuperäinen uutinen julkaistu 11.6.2021 Vesikirjeessä