Arkistot tutkimuksen mahdollistajina

27.6.2018

Tiedon avoimen saatavuuden ja tietosuojan yhdistäminen on arkistojen tulevien vuosien keskeisiä haasteita.

Nykyaikaiset arkistot ovat monitieteellistä tutkimusta palvelevia infrastruktuureita. Sähköisten aineistojen tutkimuskäyttö ei ole sidottu aikaan eikä paikkaan.

Koska tutkijat käyttävät entistä vähemmän analogisia aineistoja, muuttuvat arkistot tutkimusprosessin mukana ja muokkaavat palveluitaan vastaamaan digitaalisen tutkimuksen tarpeita. Koneoppiminen on yksi tehokkaimmista tavoista pusertaa aineistosta kaikki saatavilla oleva hyöty.

Arkistoaineistot antavat tutkimuksellisesti luotettavan ja todistusvoimaisen kokonaiskuvan eri aikakausien suomalaisesta yhteiskunnasta ja sen eri toimijoista.

Arkistot osana vastuullista tiedettä

Valtioneuvoston 3.3.2011 antaman periaatepäätöksen mukaan julkisin varoin tuotettujen tietoaineistojen uudelleenkäyttöä ja saatavuutta tulee edistää. Avoin saatavuus tarkoittaa myös sitä, että käyttörajoitettuja henkilötietoja tai muita salassa pidettäviä tietoja sisältävät aineistot ovat vahvasti suojattuina käytettävissä verkkopalveluiden kautta. Tutkija tai muu tiedon tarvitsija sitoutuu siihen, että käyttää tietoja ilmoittamaansa tarkoitukseen.

Tutkijoiden toimintaa määrittää myös Tutkimuseettisen neuvottelukunnan linjaama hyvä tieteellinen käytäntö, johon Kansallisarkistokin on sitoutunut.

Sivistysvaliokunta on vuonna 2016 todennut, että arkistoaineistojen kuvailutietojen tuominen verkkopalveluihin lisää tuntuvasti julkisilla varoilla tuotetun ja kootun aineiston avoimuutta ja hyödynnettävyyttä. Siten myös arkistoitujen henkilötietoja tai muutoin käyttörajoitettuja tietoja sisältävien aineistojen tulee palvella tarkoituksenmukaisella tavalla tutkijoita, viranomaisia ja kansalaisten tietotarpeita. 

Arkistoaineistot antavat tutkimuksellisesti luotettavan ja todistusvoimaisen kokonaiskuvan eri aikakausien suomalaisesta yhteiskunnasta ja sen eri toimijoista.

Komissio julkaisi toukokuussa 2018 tiedonannon Kohti yhteistä eurooppalaista data-aluetta. Sen tavoitteena on voimistaa EU:n kilpailukykyä ja innovatiivisuutta avaamalla julkista ja yksityistä dataa avoimeen käyttöön.

Linjaus edellyttää ratkaisuiltamme kansainvälistä yhteentoimivuutta. Onnistunut toteuttaminen lisää kuitenkin merkittävästi tutkijoiden ja päätöksentekijöiden käytössä olevan julkisen tiedon luotettavuutta ja vahvistaa entisestään arkistojen yhteiskunnallista vaikuttavuutta.

Arkistoaineistojen luotettavuus

Suuri osa julkishallinnon tietoaineistoista on rekistereitä, joista monet ovat henkilörekistereitä. Tästä seuraa erityisvaatimuksia niiden tutkimuskäytölle, mikä vaikuttaa digitaalisten palveluiden toteuttamiseen.

Tutkimuskäytössä keskeistä on eri rekisterien tietojen yhdistäminen uuden tiedon tuottamiseksi. Tiedon avointa saatavuutta korostavan Euroopan data-aluetta koskevan tiedonannon ja yleisen tietosuoja-asetuksen yhdistäminen hallituksi toimintatavaksi on yksi tulevien vuosien keskeisistä haasteista.

Rekisteritiedot ja muut henkilötietoja sisältävät aineistot arkistoidaan siten, että ne mahdollistavat tietojen turvallisen yhdistämisen. Tutkijoille yhdistetyt tiedot tarjotaan joko pseudonymisoidussa tai toisinaan jopa anonymisoidussa muodossa niin, etteivät yksittäistä henkilöä koskevat tiedot paljastu.

Arkistoitavista aineistoista ei voi poistaa henkilötietoja, koska aineistojen on oltava muuttamattomassa muodossa ja aineistojen tieteellinen tai oikeudellinen todistusvoimaisuus ei saa kyseenalaistua. Tutkijan on voitava luottaa käyttämänsä aineiston eheyteen ja muuttumattomuuteen. Luotettavuuden vaatimus koskee myös henkilötietoja sisältävien aineistojen arkistointia yksittäisen kansalaisen oikeusturvan varmistamiseksi.

Päivi Happonen on dosentti ja Kansallisarkiston tutkimusjohtaja.