FAIR-periaatteet tukevat hyvää tutkimuslaatua

12.3.2020

FAIR-lyhenne tarkoittaa, että tutkimuksen lähdeaineistojen, menetelmien ja tietotuotteiden tulee olla löydettävissä, saatavilla, siirrettävissä tai yhdistettävissä ja uudelleen käytettävissä.

Tutkimusdatasta puhuttaessa viitataan usein niin sanottuihin FAIR-periaatteisiin. Akronyymi muodostuu englannin kielen sanoista findable, accessible, interoperable ja reusable, mikä tarkoittaa, että tutkimuksen lähdeaineistojen, menetelmien ja tietotuotteiden tulee olla löydettävissä, saatavilla, siirrettävissä tai yhdistettävissä ja uudelleen käytettävissä. Näiden tavoitteiden huomioiminen alusta alkaen varmistaa hyvin dokumentoidun tutkimuksen lisäksi sen, että myös muut tutkimuksen osat kuin perinteiset julkaisut kirjoina tai artikkeleina luetaan ansioiksi. Oikeastaan ajatus, että tutkimustuloksia voisi julkaista ilman kunnollisia lähdeviittauksia on outo, mutta digitalisaatio on valitettavasti johtanut moneen tällaiseen tilanteeseen.

Neuvojen hakeminen oman organisaation tutkimuspalveluista on siis hyvä idea, mikäli tuntee olevansa epävarma siitä, miten pitäisi toimia.

Itse FAIR-periaatteet ovat hyvinkin konkreettisia teknisiä eritelmiä, joita voi olla vaikea ymmärtää ja vielä vaikeampi yksittäisen tutkijan toteuttaa yksin. Käytännössä tarvitaan infrastruktuuria ja digitaalisia palveluja tutkimusdatan julkaisemiseksi. Onneksi tällaisia alkaa olla saatavilla, mutta niiden käyttäminen voi edelleen olla ajoittain haasteellista käytännöllisistä tai oikeudellisista syistä. Neuvojen hakeminen oman organisaation tutkimuspalveluista on siis hyvä idea, mikäli tuntee olevansa epävarma siitä, miten pitäisi toimia. On myös tärkeää, että organisaatio ymmärtää tutkijoiden tarpeita. Tämä ymmärrys syntyy tutkijoiden ja datatuen välisessä yhteistyössä. Alue on usein uusi ja monimutkainen kaikille osapuolille.

Teknisissä eritelmissä on usein kyse siitä, että tutkimusdata tulee varustaa tarpeellisella dokumentaatiolla metadatan muodossa. Metadatan tulee lisäksi olla muidenkin kuin tutkijoiden käytettävissä ja sen tulee myös olla koneellisesti luettavassa muodossa. Tämä tarkoittaa sitä, että sen tulee olla hyvin jäsenneltyä ja siinä tulee käyttää yhteisiä käsitteitä ja avointa muotoa. Käytännössä tämä voidaan varmistaa käyttämällä datan julkaisuun niitä palveluita, jotka on tehty juuri sellaiselle tutkimusdatalle, jota itse tuottaa. On tärkeä muistaa, että vaikka itse tietoja ei voi asettaa vapaasti saataville, metadata voidaan julkaista. Muita tärkeitä huomioitavia asioita ovat lisenssin tarpeellisuus, joka kertoo minkälaisin ehdoin dataa voidaan käyttää, sekä pysyvä tunniste. Jälkimmäistä kutsutaan usein PIDiksi englannin persistent identifier -termin mukaan. Usein tämä on DOI tai URN, jotka muodostavat FAIR-periaatteen keskeisen tekijän, koska uniikki ja pysyvä tunniste on lupaus siitä, että siihen liittyvä data ei ole muuttunut tai ainakin muutokset on dokumentoitu.

Tutkijan tulee ottaa huomioon kollegansa ja tutkijayhteisö tarjoamalla mahdollisuutta osaksi todentaa tutkimus ja osaksi löytää ja käyttää tutkimusmateriaalia uudelleen.

Tutkijan tulee siis ottaa huomioon kollegansa ja tutkijayhteisö tarjoamalla mahdollisuutta osaksi todentaa tutkimus ja osaksi löytää ja käyttää tutkimusmateriaalia uudelleen. Toisin sanoen: Ota huomioon, että sinun tulee huolellisesti siteerata myös omia digitaalisia lähteitäsi. Tarvitset tätä varten PIDin, jonka saat, kun rekisteröit tai julkaiset dataasi. Tämän tehdessäsi sinun tulee myös ottaa huomioon, että dokumentoit ne tarkasti metadatan avulla niin, että joku toinen oikeasti voi ymmärtää ja käyttää niitä oikealla tavalla.

FAIR-periaatteet pohjautuvat piireihin, joissa työskennellään linkitetyn datan ja semanttisen verkon parissa. Mikäli näitä periaatteita on mahdollisuus huomioida esimerkiksi tietokantojen rakentamisessa, se on suuri etu. Usein kuitenkin riittää, että tietoaineisto julkaistaan sopivassa tietoarkistossa ja käytetään pysyviä tunnisteita aina kun mahdollista johonkin viitatessa.

Jessica Parland-von Essen, tietoasiantuntija, dosentti ja vanhempi koordinaattori, CSC - Tieteen tietotekniikan keskus.


Lisätietoja:

Fairdata.fi: www.fairdata.fi
Wilkinson, M., Dumontier, M., Aalsbersberg J.J. et al. (2016). The FAIR guiding principles for scientific data management and stewardship. Scientific Data. Vol 3. >http://dx.doi.org/10.1038/sdata.2016.18
UNIFI ry Suomen yliopistojen rehtorineuvosto (2018). Avoin tiede ja data. Toimenpideohjelma suomalaiselle tiedeyhteisölle.http://urn.fi/URN:NBN:fi-fe2018052424593
Laine, H. & Nykyri, S. (2018). Dataviittaamisen tiekartta tutkijalle. Informaatiotutkimus, 37(2).https://doi.org/10.23978/inf.72999
H2020 On line manual. European Commission. Research and innovation. H2020 Participant portal. Retrieved from http://ec.europa.eu/research/participants/docs/h2020-funding-guide/cross-cutting-issues/open-access-dissemination_en.htm
Finnish Committee for Research Data (2018).Tracing data : Data citation roadmap for Finland.http://urn.fi/URN:NBN:fi-fe201804106446
Force11. The FAIR data principles.https://www.force11.org/group/fairgroup/fairprinciples