Tutkijan muistilista tutkimusdatan julkaisemiseen

12.6.2018

Mitkä asiat kannattaa ottaa jo hyvissä ajoin huomioon, kun miettii tutkimusdatansa julkaisemista?

1. Sovi ajoissa datan omistajuudesta

Datan saa julkaista tai avata vain datan omistajan luvalla. Jos keräätte datan itse, tehkää datan omistajuudesta kirjallinen sopimus kaikkien osapuolten kesken, mielellään jo ennen datan keräämistä.  Jos taas käytätte muiden keräämään dataa, varmistakaa datan julkaisuoikeus ennen datan luovutusta. Pyytäkää tästä kirjallinen sopimus.

Ilman kirjallisia sopimuksia datan omistajuus on monimutkainen vyyhti selvitettäväksi. Voit jättää sopimukset tekemättä vain, jos teet tutkimuksen kaikki vaiheet yksin ilman ohjausta.

2. Mieti jo tutkimusta suunnitellessasi, missä aiot julkaista datasi

Suositteleeko tutkimusrahoittajasi data-arkistoja (ks. rahoittajan ohjeet ja esim. Sherpa/Juliet)? Entä lehti, jossa julkaiset tutkimustulokset (ks. lehden kirjoittajan ohjeet ja esim. FairSharing.org)?

Data kannattaa julkaista siellä, missä muutkin alasi tutkijat julkaisevat. Kysy siis kollegoilta, etsi dataviittauksia alasi tutkimusjulkaisuista tai katso hakupalveluista, missä vastaavia aineistoja on aiemmin julkaistu (esim. Re3Data.orgDataMed yms.)

Jos tutkimuksesi tuottaa monenlaista dataa, tallenna kukin datatyyppi sille parhaiten sopivaan paikkaan, sen sijaan että tallentaisit kaiken yhteen arkistoon. Esimerkiksi joku arkisto soveltuu parhaiten kyselyaiheistoille, toinen kuvantamisdatalle ja niin edelleen. Muista tallentaa datan mukana kuvaus siitä, mistä kokonaisuuden osaset löytyvät.

Osa arkistoista julkaisee kaiken sinne tallennetun datan, osassa on tiukat laatukriteerit. Hyvä data-arkisto antaa datalle pysyvän tunnisteen (esim. DOI tai URN), jonka avulla dataan on helppo viitata julkaisuissa. Data-arkistoa valittaessa huomioi myös minkälaisia tukipalveluita arkisto tarjoaa sekä miten aineiston pääsynhallinta on järjestetty.

3. Huomioi data-arkiston vaatimukset dokumentaatiolle, metadatalle ja tiedostoformaatille

Laadukkaat data-arkistot pitävät huolen siitä, että aineisto on helposti jatkokäytettävissä, ja tämän vuoksi niillä on vaatimuksia aineiston formaatille ja dokumentaatiolle. Datan julkaiseminen ei yksin riitä, vaan datan pitää olla dokumentoitu siten, että se on ymmärrettävää ja tutkimustulokset ovat datan perusteella helposti todennettavissa. Datan formaatti ei myöskään voi olla eksoottinen, vaan tarkoitus on suosia yleisesti käytössä olevia tiedostomuotoja.

Datan dokumentaation täydentäminen tutkimuksen jälkeen on vaikeaa ja työlästä. Siksi dokumentaatio suunnitellaankin projektin alussa ja toteutetaan tutkimuksen edetessä. Vaikka tämä vie aikaa alussa, se yleensä helpottaa ja lopulta nopeuttaa tutkimuksen tekemistä.

4. Muista tutkittavien tietosuoja

Jos aineistosi sisältää sensitiivistä informaatiota, kuten arkaluonteisia henkilötietoja, täytyy sinun selvittää, voiko aineistoa julkaista esimerkiksi anonymisoituna. Lisätietoja tunnisteellisuudesta ja anonymisoinnista on esimerkiksi Tietoarkistossa. Apua ja neuvoja tietosuojakysymyksissä saat ottamalla yhteyttä organisaatiosi tukipalveluihin.

5. Valitse datalle sopiva lisenssi

Datan jatkokäytön ehdot voit määritellä vaikkapa Creative Commons -lisensseillä. CC-lisenssillä julkaiseminen tarkoittaa osan oikeuksista tarjoamista käyttäjillle sinun määrittelemilläsi ehdoilla. Dataan liittyville algoritmeille, koodeille ja ohjelmistoille sopivat esimerkiksi MIT- ja GNU-GPL-lisenssit.

Esimerkiksi Kielipankkiin ja Tietoarkistoon on mahdollista tallentaa sekä avoimesti lisensoituja aineistoja että sellaisia aineistoja, joiden käyttöehtoihin liittyy rajoituksia esimerkiksi henkilötietojen vuoksi. Tutustu valitsemasi data-arkiston ohjeistukseen ja/tai ota arkistoon yhteyttä mahdollisimman varhaisessa vaiheessa, jotta datan jatkokäytön mahdollisuudet voidaan varmistaa.

Jos tarvitset neuvoja datan julkaisemiseen, pyydä apua oman organisaatiosi kirjastosta tai data-arkistosta, kuten Tietoarkistosta tai Kielipankista.

Mari Elisa Kuusniemi, Katri Larmo ja Siiri Fuchs työskentelevät tietoasiantuntijoina Helsingin yliopiston kirjaston Datatuessa.