Henkilötietoja suodattava kielimalli työasemassa
Kampanja: Kaupunkilaispalvelut 2025
Kokeilun tarve ja tavoitteet
Pilvipalveluissa toimivien kielimallien käyttö opetuksessa on tällä hetkellä haasteellista, koska ne eivät mahdollista henkilötietoja sisältävien dokumenttien turvallista käsittelyä. Esimerkiksi oppilaiden tietoja sisältäviä tekstejä ei voida suoraan käsitellä pilvipalveluissa, mikä rajoittaa kielimallien hyödyntämistä kouluissa.
Kokeilun tavoitteena on kehittää paikallisesti toimiva sisällönsuodatinratkaisu, joka poistaa tai anonymisoi henkilötiedot ennen dokumentin lähettämistä pilvipalveluun. Tavoitteena on, että ratkaisu mahdollistaisi kouluissa sekä kielimallin tietoturvallisen hyödyntämisen että sen käytön opettelun osana opetusta. Lisäksi kokeilussa selvitetään, onko kielimalli oikea ratkaisu tähän haasteeseen ja miten anonymisointi vaikuttaa datan laatuun ja käytettävyyteen.
Kokeilun eteneminen
Kokeilu toteutetaan yhteistyössä Ai4Value-yrityksen kanssa. Sen aikana suunnitellaan sisällönsuodatinratkaisu, joka laadukkaasti ja tehokkaasti poistaa tai anonymisoi henkilötietoja tekstidokumenteista. Sovellus kehitetään paikallisille laiteresursseille, jotta tietoja voidaan käsitellä turvallisesti. Kehityksen loppuvaiheessa sovellusta testataan ja parannetaan opitun perusteella.
Kokeilun opit
Kokeilussa toteutettiin selainpohjainen ohjelmisto, joka hyödyntää Googlen avointa Gemma 3 4b –kielimallia. Kokeilijat testasivat ohjelmistoa esittämällä sille kysymyksiä, joita oppilaat saattaisivat kysyä. Kokeilu osoitti, että paikallinen kielimalli ei vielä sovellu oppilaiden viestien käsittelyyn, koska se ei pysty riittävän hyvin suojaamaan henkilötietoja. Sen sijaan kielimallin suomen kielen osaaminen oli riittävällä tasolla.
Suositukset jatkotoimenpiteiksi
Kokeilijat suosittelevat kokeilun uusimista, kun kielimallit ovat riittävästi kehittyneet. Ohjelmiston jatkokehityksessä voitaisiin yhdistää kielimalli ja perinteinen sääntöpohjainen filtteröinti. Pienellä kielimallilla on mahdollista kehittää henkilötietoja suodattava toiminnallisuus lisäämällä esimerkkidataa ja jatkokouluttamalla mallia. Lisäksi suurempaa ja älykkäämpää avointa kielimallia voisi hyödyntää tehokkaammalla huonekohtaisella “portinvartijakoneella” esimerkiksi opettajan valvonnassa.
Kokeilun projektipäällikkö
Jorma Nordlin, jorma.nordlin@hel.fi, Kasvatuksen ja koulutuksen toimiala

0 kommenttia
Ladataan kommentteja ...
Lisää oma kommenttisi
Kirjaudu sisään tai rekisteröidy palveluun kommentoidaksesi.
Ladataan kommentteja ...