ABCDEFGHIJKLMNOPQRSTUVWXYZ
1
KOMMENTOIJAPERIAATE 1PERIAATE 2PERIAATE 3TAVOITE 1TAVOITE 2TAVOITE 3TAVOITE 4TAVOITE 5JOHDANTOYLEISIÄ KOMMENTTEJA
2
MaanpuolustuskorkeakouluPeriaate on hyvä ja kannatettava.

Tutkimusaineistoa pitää avata vain vastuullisesti. Tässä tutkijoiden pitää muistaa tutkimusaineiston mahdollisesti sisältämä luottamuksellinen (tai muuten salassapidettävä) tieto ja sen aiheuttamat rajoitukset tutkimusaineiston avaamisessa.

Organisaation vastuulla on varmistua koulutuksella ja avoimella keskustelulla, että tutkijoilla on riittävä osaaminen tutkimusaineiston käsittelyssä ja avaamisessa.
Periaate on hyvä ja kannatettava.

Organisaation tulee tarjota tukea infrastruktuurin ja palveluiden tarjoamisen kautta tutkijoille, jotta tutkimusaineistoa voidaan käsitellä ja jakaa vastuullisesti ja asiantuntevasti. Organisaation tulee palvella tutkijoita ja mahdollistaa tutkijoiden mahdollisimman tehokas työpanos omassa toiminnassaan.
Periaate on hyvä ja kannatettava.

Tutkijan uralla meritoitumisessa, esim. professorin virkaan/tehtävään valittaessa tutkimusaineiston avaamista ja/tai tutkimusaineiston käyttöä kehittävää työtä tulisi arvioida ja arvostaa samalla tavoin kuin tieteellistä julkaisutoimintaakin.

Organisaatioiden tulee kehittää akateemisen meritoitumisen arviointikriteerejä ottamaan huomioon myös tutkimusaineiston avaaminen yhtenä tieteellisen kelpoisuuden arviointikohteena.
Tavoite datanhallinnan suunnitelman edellyttämisestä uusissa hankkeissa on hyvä. Tällä varmistutaan, ettei kerätty tieto vahingossa katoa tutkimuksen päätyttyä.

Ajatus ohjeistuksen laatimisesta ja kouluttamisesta organisaatiossa on hyvä.
Toimintatapamallien laatiminen organisaatiossa on hyvä asia.Tutkimusdatan dokumentointi jatkokäytettävyyttä, löydettävyyttä, yhteentoimivuutta ja saavutettavuutta varten on hyvä asia. Dokumentointi tulee suhteuttaa tutkimusdatan arvoon/määrään/laatuun. Eli dokumentointi ei saa olla itsetarkoitus, joka johtaisi siihen, että suurin osa ajasta menisti datan dokumentointiin eikä datan keräämiseen ja käyttämiseen.Tutkimusdatan säilyttäminen asiaankuuluvassa arkistossa (tietoarkisto/tietokanta/vast.) on tärkeää. Tietomäärät voivat olla valtavia, mutta niiden tallentaminen pitää varmistaa siten, ettei arkiston vaihtaminen tai päivittäminen tuhoa tai tee muuten tutkimusdataa käyttökelvottomaksi.Avoin tutkimusdata voi tulevaisuudessa luoda uudenlaisia, arvostettuja rooleja tutkimusympäristöön (datan kerääjät, tiedon analyytikot, tietojen yhdistelijät, jne.) sekä luoda uudenlaisia palvelukonsepteja (tiedon tallentaminen, tekoälypalvelut, jne,). Tällaiset uudet roolit vaativat myös koulutuksen päivittämistä uusia haasteita vastaaviksi.
3
Oulun yliopistoDokumentissa on aiemmin määritelty “datan vastuullinen hallinta” ja “tutkimusdatan avoimuus”, mutta ei vastuullista avaamista. Periaatteen varmistamisen ja seurannan perusteella kyseessä voisi olla hyvän tieteellisen käytännön toteutuminen eli tutkimusaineistojen vastuullista avaamista seurataan hyvän tieteellisen käytännön toteutumisen kautta. Vai onko kyse aineistojen vastuullisesta hallinnasta, joka on edellytys aineistojen avaamiselle? Mikäli näin, niin voisiko periaate olla “Avataan vain vastuullisesti hallittua tutkimusaineistoa”?A. Pitäisikö olla “aineistonhallinnan infrastruktuureille” eikä “tutkimusinfrastruktuureille”?
B. Onko kyseessä yleinen suositus seurantaan vai koskeeko aineistonhallintaa? Jos jälkimmäinen, niin voisiko asian tuoda esille tekstissä esim. “...tavoitteena on aineistonhallinnan palveluiden ja infrastruktuurien kehittäminen”.
Ehdotamme periaatteelle muotoa: “Tutkimusaineistojen hyvä hallinta ja avaaminen sekä muu niihin liittyvä työ meritoivat tutkijaa.”

Myös Kohta A:ta voisi muokata hieman esim:  Viimeistään vuonna 2022 Avoimen tieteen koordinaatio laatii suosituksen hyvistä käytännöistä eli siitä, kuinka hyvän datanhallinnan edistäminen, tutkimusdataan liittyvä työ ja tutkimusdatan avaaminen huomioidaan tutkijan työssä ja meritoitumisessa. 
Hyvä ja kannatettava tavoite.

Tässä tutkimusdatan osalinjauksessa käytetään termiä datanhallintasuunnitelma. Suomessa on käytetty yleisemmin sen synonyyminä termiä aineistonhallintasuunnitelma. Toisaalta tutkimusaineisto ja -data tarkoittavat käsitteenmäärittelyn mukaan eri asiaa, joten onko tarkoitus tai tarpeen käyttää jatkossa kansallisessa työssä kahta sisällöltään hyvin lähellä toisiaan olevaa termiä?

Kolmas toimenpide on varsin vaikea toteuttaa ja siksi aikataulun suhteen liian tiukka:
“Vuoteen 2023 mennessä tutkimusorganisaatiot huolehtivat, että opinnäytetöiden ohjaajat osaavat arvioida ja kommentoida datanhallintasuunnitelmia”

Ehdotamme neljänteen toimenpiteeseen lisäystä siten, että myös tuen resursointi huomioidaan:
“Vuoteen 2023 mennessä tutkimusorganisaatiot tukevat tutkimuksen suunnittelua siten, että datanhallinnan ja sen tuen riittävään resursointiin ja kustannuksiin osataan varautua.”

Ehdotamme, että datanhallintasuunnitelmien toteutumisen seuranta lisätään vaadittaviin toimenpiteisiin.
Tavoite on erittäin tärkeä, mutta ehdotamme sen lyhentämistä muotoon: “Vuoteen 2023 mennessä tutkimusorganisaatioissa on toimintamallit, joilla tutkimusdatan käyttöön liittyvät oikeudet, ehdot ja lisenssit sovitaan selkeästi kaikkien asianomaisten toimijoiden kesken.”, koska lisenssejä koskeva lause sisältyy toimenpiteisiin.

Ehdotamme ensimmäiselle toimenpiteelle seuraavaa muotoilua: “Avoimen tieteen koordinaatio käynnistää viimeistään vuoden 2021 aikana selvityksen avoimen tieteen juridisista kysymyksistä. Yhteistyössä suomalaisen tutkimusyhteisön kanssa luodaan kansallisia suosituksia sopimusmalleiksi.”

Onko toisen toimenpiteen aikataulu realistinen? Jos kansallinen selvitystyö käynnistyy 2021, niin ehtivätkö organisaatiot toimia vuoteen 2022 mennessä? “Vuoteen 2022 mennessä tutkimusorganisaatiot ovat julkaisseet selkeät perusperiaatteet tutkimusdatojen oikeuksien ja vastuiden sopimisesta. Erikoistapauksiin on tarjolla neuvontaa ja opastusta.”
Kannatettava tavoite.

Ehdotamme ensimmäisen toimenpiteeseen seuraavaa muotoilua: “Vuoteen 2023 mennessä tutkimusorganisaatiot ottavat käyttöön tukipalvelut ja kannustimet tutkijoille metadatan tuottamiseen ja avaamiseen.” Vuosilukua ehdotamme siirrettäväksi, koska kannusteiden osalta ei ole olemassa vielä kansallista suositusta ja siksi organisaatioilla voi olla vaikeuksia luoda kannustimia vuoden 2021 aikana.

Pyydämme määrittämään mitä “metadatan dokumentointi” tarkoittaa.

Ehdotamme toisen toimenpiteen muotoiluksi: “Vuoteen 2023 mennessä tutkimusorganisaatiot tarjoavat kattavasti tutkimusdatan dokumentoinnin koulutusta ja neuvontaa sekä työkaluja tutkimusdatan dokumentoinnin toteuttamiseen.”
Hyvä ja kannatettava tavoite.

Ehdotamme muutosta ensimmäiseen toimenpiteeseen: “...kartoittavat olemassa olevien palveluiden heikkoudet ja vahvuudet. Organisaatiot käynnistävät tarvittavat kehittämistoimenpiteet.”
Kannatettava tavoite.

Voisiko “Ammatillinen rooli” olla asiantuntijuus tai asiantuntijatehtävä?
Ehdotamme, että “Ammatillinen koulutus” muutetaan muotoon “koulutus asiantuntijuuteen”.
Johdanto on selkeä, mutta suurin uhka eli resurssit/raha jäävät mielestämme liian pienelle huomiolle. Linjauksen tavoitteiden saavuttaminen ja toimenpiteiden toteuttaminen tulee vaatimaan tutkimusorganisaatioilta merkittäviä satsauksia. Haluamme korostaa, että tavoitteet jäävät saavuttamatta ilman linjauksen toteuttamiseen suunnattua rahoitusta.

Sanaston ja termien osalta ehdotamme seuraavaa:
- Onko repositorio tässä yhteydessä julkaisuarkisto tai vaikka “Tutkimusaineistotyypille ja - menetelmille valitaan aina parhaiten sopiva tallennuspalvelu.”
- Ehdotamme, että verifioida-sana korvataan suomenkielisellä todentaa-sanalla.
- Voisiko otsikko “Kansainvälinen konteksti” olla suomeksi “Kansainvälinen yhteys” tms.?
- Dialogin tilalle ehdotamme: “Suomalainen tutkimusyhteisö osallistuu aktiivisesti kansainväliseen vuoropuheluun, jossa voimme omaksua hyviä käytäntöjä ja olla mukana luomassa toimivia ratkaisuja.”
- Lisäksi tutkijat kantavat huolta “sensitiivisten” ja luottamuksellisten tutkimusaineistojen ja -menetelmien avaamisesta. Voisiko olla “arkaluonteisten”?
- Sanasto, Metadata: Pyydämme lisäämään alkuun sanan “kuvailutiedoilla”. Voisiko sanan “konteksti” korvata sanalla “yhteyksiä”?
- Sanasto-osuudessa voisi olla myös termi “dokumentaatio”.
Kokonaisuutena osalinjaus on hyvä ja kannatamme sen periaatteita sekä tavoitteita.

Toimenpiteet, tavoitteet ja aikataulut on esitetty selkeästi. Dokumentin alussa voisi kuitenkin tuoda selkeämmin esille sen, että kommentoitavassa luonnoksessa on kyseessä vain osalinjaus 1.

Yleinen huomio periaatteista: Kun linjausdokumenteissa esitellään keskeisiä periaatteita, olisi ne hyvä esittää niin, että niillä on selkeä sisältö, periaate jota noudattaa. Esimerkiksi tämän linjausluonnoksen periaatteissa 1 ja 2 sisältöä ei ole määritelty kovin tarkasti, jolloin lukija joutuu tulkitsemaan ja etsimään muualta dokumentista tukea omille tulkinnoilleen. Myös lisämäärittelyt voisivat helpottaa periaatteiden ymmärtämistä.

Liite 1 on tarpeellinen ja selkeä. Aikataulutus on kuitenkin esitetty hieman hämäävästi, sillä linjausluonnoksessa puhutaan esim. “vuoteen 2022 mennessä”, mutta Liitteessä mainitaan vain vuosi 2022, joka antaa kuvan, että asia saatetaan kuntoon vuoden 2022 aikana. Myös pari pientä kohtaa voi vaatia tarkennusta: Vuoden 2021 kohdalla mainitaan jälleen tutkimusinfrastruktuurit, mutta pitäisikö olla datainfrastruktuurit? Vuoden 2024 kohdalla mainitaan suluissa pitkäaikaissäilytys, jota ei mainita missään aikaisemmin.
4
Turun YliopistoPeriaate nähdään hyvänä ja kannatettavana.
Epäselvää kuitenkin on, että kenellä on vastuu ja mistä asiasta.
Epäselväksi luonnosdokumentissa jää myös se, miten menetelmien avoimuus huomioidaan eli tuleeko menetelmien avoimuudesta oma osalinjaus?
Huolena, että tutkijoilta vaaditaan teknistä asiantuntemusta esim. tallennuspalveluista, joka voi tulla esteeksi näiden palveluiden hyödyntämisessä.
Huolena, että periaatteen toteuttaminen ja sen toteutumisen systemaattinen seuranta vaativat uusia resursseja esim. työryhmiä/palveluita/teknisiä ratkaisuja, joita tutkimusorganisaatioissa ei vielä ole.
Huolena, miten OKM:n toteuttaa kehittymisen seurannan ja minkälaisia vaikutuksia tällä on tulosneuvotteluihin.
Tutkimusaineiston avaaminen ei voi olla meritoitumisen mittari, koska tutkimusaineiston avaamista rajoittavat tutkijasta riippumattomat syyt. Tutkimusaineistojen avaaminen on erityisesti yksittäisen tutkijan näkökulmasta haastavaa ja siihen vaikuttaa vahvasti tieteenalojen eri käytännöt. Lisäksi huomioon tulisi ottaa, että lainsäädäntö, esimerkiksi tietosuojalainsäädäntö (GDPR), asettaa omat haasteensa tutkimusaineistojen avaamiselle.
Erityisesti kun puhutaan tutkimusaineistojen avaamisesta tutkijan ansiona olisi tärkeää muistaa, että tutkimusaineistojen avaamisesta ei saa tulla tutkimusaiheita tai –prosesseja ohjaavaa vaan tutkijoiden tulee
saada myös tutkia aiheita ja ilmiöitä, joissa kerätään tutkimusaineistoa, joka ei välttämättä ole avattavissa.
Tämän vuoksi otsikko tulee kriittisesti arvioida uudelleen. Otsikkoehdotus: Tutkijan ansioita hyvän aineistohallinnan ja tutkimusaineiston avoimuuden edistämiseen liittyvää työtä arvostetaan
meritoitumiskriteereissä.
Tärkeää olisi myös, että hyvän aineistohallinnan ja tutkimusaineiston avoimuuden edistämiseen mittareihin ja kannustimiin tehtäisiin yhteinen linjaus. Millä taholla on tähän paras asiantuntemus?
Datanhallinnan koulutuksen sisällyttäminen koulutukseen on hyvä ja kannatettava tavoite.
Epäselväksi tuntuu jäävän, kuinka laajasti näitä tavoitteita tulee toteuttaa (erityisesti opinnäytetytöt: kanditutkielmat/pro gradut/väitöskirjat).
Tämän tavoitteen kohdalla olisi hyvä tarkentaa, että oikeudet ja lisenssit on sovittava sen mukaan, millaisesta aineistosta on kyse.
Tavoitteessa on epäselvästi ilmaistu, että ”tutkimustuotosten yhteiskunnallinen vaikuttavuus tulee saavuttaa kaupallistamisella”. Yhteiskunnallinen vaikuttavuus voi syntyä muutenkin kuin kaupallistamisesta vaikka kaupallisuus toki on yksi tärkeä tekijä vaikuttavuuden kannalta.
Tavoitetta pidettään kannatettavana.
Laatuindikaattorien tulisi olla kansallisia ja tutkimusalakohtaisia, jos jokainen tutkimusorganisaatio laatii oman laatuindikaattorin, niin miten laatua voidaan seurata ja arvioida kansallisella tasolla?
Tavoitteen aikataulu ei ole linjassa muiden tavoitteissa määriteltyjen aikajänteiden kanssa.
Tavoitteissa ei ole huomioitu fyysisten tutkimusaineistojen säilytyspaikkaan liittyviä konkreettisia toimenpiteitä.
Hyvä ja kehittämisen arvoinen tavoite. Erityisesti tutkijalähtöinen ja urapolkuihin liittyvät toimenpiteet tärkeitä.Teksti vaatii vielä oikolukemista ja terävöittämistä ja myös sen selkeyttämistä, mitä muissa linjauksissa ja itse julistuksessa jo sanotaan.
Alaviitteet eivät toimi linjaustyyppisessä dokumentissa, jonka pitäisi olla lyhyt ja selkeä.
”Strategiset periaatteet” näyttäytyvät luonnoksessa kuuluvan johdantoon, mutta epäselväksi jää, että ovatko ne osalinjauksen eli Tutkimusdatan avoimen saatavuuden osalinjauksen periaatteita vai ovatko ne TUTKIMUSAINEISTOJEN JA –MENETELMIEN AVOIMEN SAATAVUUDEN LINJAUKSEEN kuuluvat periaatteet, joiden tulisi koskea myös menetelmien avoimuutta. Nyt vaikuttaa, että nämä koskisivat vain tutkimusdatan avoimuutta.
Luonnoksessa olisi hyvä tuoda esille osalinjauksen suhde Avoimen tieteen ja tutkimuksen julistukseen. Muun muassa tätä voisi edistää sillä, että osalinjauksien johdanto- osassa tulisi esille Avoimen tieteen ja tutkimuksen julistuksen aikajänne, joka on 2020-2025, johon siis osalinjauksen aikataulu perustuu.
Osalinjauksen toimenpiteiden tulisi olla kannustavia ennemmin kuin käskeviä. Niiden tulisi myös ohjata yliopisto-organisaatioita itsenäisesti ja yhdessä miettimään minkälaisia infrastruktuureja ja palveluita olisi tarve kehittää ja tuoda tutkijoiden tueksi. Vastuuta tutkimusaineistojen avaamisesta ei voida täysin siirtää tutkijoiden vastuulle. Lisäksi linjauksen tulisi huomioida, että eri tieteenalat etenevät tutkimusaineiston avaamisessa eritahtia. Monilla tutkimusaloilla on jo olemassa olevia hyviä avoimiin aineistoihin liittyviä käytänteitä ja infrastruktuureja, mutta osa tieteenaloista on ns. katvealueilla, joissa käytänteitä ja infrastruktuureja ei vielä ole. Nämä eri lähtökohdat tulisi ottaa huomioon osalinjauksen tavoitteissa ja toimenpiteissä.
Lisäksi tässä luonnoksessa ei ole otettu kantaa siihen uhkakuvaan, että kaupalliset tieteelliset kustantamot siirtäisivät julkaistavaan tutkimukseen liittyvän tutkimusaineiston maksumuurin taakse. Tämä asia tulisi huomioida strategisissa tavoitteissa vuosien 2020-2025 aikana.
Huolena on, että miten toimenpiteiden toteutumista seurataan. Miten toimenpiteet vaikuttavat meritoitumiseen ja OKM:n arviointeihin ja sitä kautta tulosneuvotteluihin.
Huolena on osalinjauksen aikataulun realistisuus. Osalinjauksessa mainitut tavoitteiden toteuttamisajat painottuvat vuosille 2021-2023 ja Avoimen tieteen ja tutkimuksen julistus kuitenkin ulottuu vuoteen 2025.
Kaikkea ei ehkä ole syytä tehdä heti. Tulisi siis miettiä missä kohdin aikataulua on tarpeellista tuoda esille.
Esimerkiksi kun periaatteiden tarkoitus on olla ylemmän tason linjauksia, jolloin onko niiden kohdalla tarpeellista tuoda esiin aikataulua, koska joka tapauksessa periaatteet koskevat vuosia 2020-2025 (Avoimen tieteen ja tutkimuksen julistus)?
Huolena on, että osalinjauksessa määriteltyihin toimenpiteisiin tarvitaan huomattava määrä resursseja. Linjaus on kirjoitettu paljolti tukipalveluiden näkökulmasta. Nyt osalinjauksessa resursointivastuu on jätetty täysin tutkimusorganisaatioille, mutta onkohan tämä täysin realistista. Miten taataan siis resurssien riittävyys? Avoimen tieteen koordinaation tulisi ottaa tähän kantaa.
5
Åbo AkademiB: Genomförandet av principen är oklar. TENK (Forskningsetiska delegationen) har inte idag mandat att följa upp att god vetenskaplig praxis förverkligas, däremot att bevaka och följa upp avvikelser från den.Principen om tillgång till tjänster och forskardriven utveckling av dem är viktig.
B Uppföljning: Att UKM följer utvecklingen i samband med resultatförhandlingarna lägger grunden för att publicerad data inbegrips i finansieringsmodellen. Modellen för utvärdering behöver beakta forskningsområdenas och forskningsorganisationernas olika forskningsprofiler och tyngdpunkter.
Mognadgradsutvärderingen (kypsyystaso 2016, 2019) kunde möjligen utvidgas istället för att införa ytterligare verktyg.
Principen att förtjänster inom forskningsdatahantering värdesätts i meriteringskriterierna är viktig, men maskinläsbar FAIR data eller öppen metadata som minimikrav får inte utvecklas till ett allmänt kriterium på god forskning eftersom det finns forskning som inte producerar data som passar in i denna modell.Delpolicyn inledning: tidtabellen att policyn gäller från 1.1.2021 är för snäv.
Mål 1: Införande av datahanteringsplaner som kvalitetsledning är bra.
Förslag: ”Öppen tillgång förutsätter en välgjord datahanteringsplan” > ”Öppen tillgång förutsätter god datahanteringsplanering”
Instruktioner, praxis och utbildning behövs men är resurskrävande. Det krävs också nationella samarbeten för att digitalisera dmp-processen eller delar av den (t.ex. för planering av och hantering av persondata i projekt). Också DMP-verktygens data (t.ex. DMPtuuli) behöver vara strukturerad i högre grad för att kunna hanteras maskinellt inom organisationerna. Här har universitet med svenska som verksamhetsspråk särskilda behov.
Målet är viktigt och nationella rekommendationer och mallar behövs.
Licensutbudet kan också behöva kompletteras där forskningsmaterial inte faller under upphovsrättslagstiftningen.
Stöd för att anordna undervisning och utbildning som nationella eller unversitetsövergripande samarbeten och inte enbart hos forskningsorganisationerna enskilt (också på svenska och engelska) bör utlysas.
Målet med god dokumentation med FAIR-idealet i sikte är bra, men ansvaret läggs helt på forskningsorganisationerna.
Stimulans bör finnas för att garantera att stöd för dokumentation kan anordnas också universitetsövergripande/nationellt för att garantera fullgott stöd för dokumentation också för små forskningsområden/sällare datatyper. Dokumentationspraxis följer inte forskningsorganisationens utan forskningsområdenas gränser.
Målet och åtgärderna är bra, men om ”forskningsorganisationerna” avser universitet och inte t.ex. CSC är det viktigt att samarbeten finns och stimuleras.Målet är en konsekvens av övriga mål.
Utbildning i god datahantering är en viktig åtgärd men passar den bättre under mål 1, eller ett skilt mål?
Det är oklart vad som avses med att ”Yrkesutbildningen utvecklas”.
Forskningens frihet och forskarens ansvar:
Första satsen: Det framstår som om finländska forskarsamfundet först i detta skede har reell möjlighet att medverka. Det är viktigt att utvecklingen av processerna och principerna för forskningsdatahantering beaktar forskningsfältens olikheter och policyns mål ”att förverkliga öppenhet på ett sätt som stöder och ökar forskarens frihet och hens möjligheter att utbyta forskningsbaserad kunskap” är bra.
”Forskarsamfundet” som ska garantera incitament och strukturer behöver preciseras och möjligen utökas. Genomgående i utkastet är forskaren i huvudrollen men många forskare har inte makt över öppnande av sitt forskningsmaterial (t.ex. inom arkivforskning) utan för att dessa forskare ska kunna delta på lika fot behöver stora förändringar ske inom de infrastrukturer som bildar ramarna för forskningen. Policyn behöver omfatta också mål för att utarbeta handlingsmodeller som stöder forskarna inom dessa infrastrukturer.
Risker och hot: Oklart vilka ”organisationerna” är.
”I vissa fall är det tillräckligt att göra beskrivande data tillgängliga”: det finns forskningsområden där öppnande av beskrivande data (metadata) inte är möjligt eller inte utgör någon förbättring av transparensen (möjligen teoretisk matematik, filosofi, en del arkiv- och litteraturforskning). Därför är det viktigt att öppning av data inte börjar förstås som allmänna meriteringskrav utan gäller där det är möjligt och förnuftigt medan ökad transparens och återanvändning av material inom övriga forskningsområden stöds med andra åtgärder.
Ordlista: Listan är upplysande och användningen av ’forskningsmaterial’ är mera inkluderande för många forskare än ’forskningsdata’.
Forskningsdata: laboratoriedagböcker är inte ett bra exempel på forskningsdata utan är ofta snarare dokumentation som platsar under ’forskningsmaterial’.
Ansvarfull hantering, perspektiv 2, FAIR-principerna: FAIR-principerna är en viktig och central formulering av ett ideal. Det vore viktigt att betona också människoläsbarhet som ett möjligt mål eftersom några forskningsområdens forskningsmaterial inte kan uppnå maskinläsbarhetsidealet.
Utkastet till delpolicy är balanserat och väl utarbetat.
Målsättningen är god.
6
Tampereen korkeakouluyhteisö, TUNI (TAU ja TAMK)Vastuullisuuden nostaminen ensimmäiseksi periaatteeksi ja sen linkittäminen hyvään tieteelliseen käytäntöön on erittäin tärkeä strateginen painopiste. Aineistonhallinta, vastuullisuus ja hyvä tieteellinen käytäntö kietoutuvat olennaisena osana yhteen (s. 7).

Onko hyvän tieteellisen käytännön toteutumisen seurantaan välineet tai tulisiko niitä ja mitattavuutta kehittää? Esim. tilastoidaanko organisaatiossa tiedevilppiepäilyt ym.? Mikä voi olla tässä avoimuuden aste?

Tässä hieman käsitteellistä heiluntaa aineiston ja datan välillä --> osalinjaus käsittelee tutkimusdataa, “päälinjaus” aineistoja --> mihin tässä siis viitataan?

Esim. tutkijan ja ohjaajien vastuu? Rahoittajien ja kehysorganisaation rooli?
Infrastruktuurien ja palveluiden nostaminen toiseksi strategiseksi periaatteeksi sekä näiden aktiivinen kehittäminen on erittäin olennaista hyvän ja vastuullisen aineistonhallinnan toteutumisessa. Tähän tarvitaan koko tutkimusyhteisön panosta.

Sanastoon tarpeen lisätä infrastruktuuri. - Palvelukin on sitä.

Jatkuva seuranta: On tärkeä nosto, että ulkoisen arvioinnin rinnalla korostetaan tutkimusorganisaatioiden säännöllistä itsearviointia, sillä se osaltaan edistää datanhallinnan infrastruktuurien ja palveluiden kehittämisen jatkumoa. OKM:n seurantaa ja siinä sovellettavia menetelmiä (ml. niiden avoimuus) tulisi kehittää laajassa ja avoimessa yhteistyössä tutkimusyhteisön kanssa. Tekstissä itsearviointien ja OKM:n seurannan suhde jää epäselväksi ja tekstiä kannattaa tältä osin tarkentaa.
Meritoituminen on tärkeää ja onkin hyvä, että linjaus pyrkii löytämään keinoja tilanteen aktiiviseen kehittämiseen. Toivottavasti tässä tapauksessa suositukset eivät valu hitaasti käytäntöön, vaan niiden implementointi organisaatioissa tapahtuu tehokkaasti.

Tärkeää on kiinnittää huomiota myös laadullisiin kysymyksiin ja siihen, että huomio on riittävästi vastuullisessa datanhallinnassa ja kansallisella sekä organisatorisella tasolla myös palveluissa. Yksittäisen tutkijan arviointi esim. kriteerinä datan avoimuus (vrt. keskeinen metadata) saattaa nopeastikin johtaa ei-toivottuun tilanteeseen, jossa suositaan tutkimusta, jonka taustalla oleva data on mahdollista avata. Tämä olisi omiaan sulkemaan pois paljon yhteiskunnalle tärkeitä tutkimuskysymyksiä.
Tämä, kuten muutkin tavoitteet, on hyvä ja asianmukainen.
Edellä tekstissä puhutaan tutkimuksen tietoaineistoista, joita ei ole kuitenkaan määritelty aikaisemmin (esim. sanastossa).
Toimenpiteet on määritelty napakasti ja ovat relevantteja. Tärkeää on myös perusopiskelijoiden kouluttamisen tarpeen huomiointi ja aineistonhallinnan osaamisen potentiaalin leviäminen osaksi opiskelijoiden työkalupakkia. Hyvä aineistonhallinta ei ole vain tutkijoiden asia, vaan osa opiskelu- ja työelämätaitoja. Erinomaista on lisäksi se, että opinnäytetöiden ohjaajien rooli datanhallinnan käytänteiden levittäjänä on nostettu yhdeksi keskeiseksi toimenpiteeksi. Datanhallinnan koulutuksen systemaattinen kehittäminen sekä perus- että jatkokoulutustasolla on olennaista laajan taitopohjan saavuttamisessa.

Olisiko loogisempi, jos tavoite olisi muotoiltu: “Avoimen saatavuuden edellytyksenä on hyvin toteutettu datanhallintasuunnitelma. Viimeistään vuonna 2023 kaikille aloittaville tutkimus- ja kehittämisprojekteille on laadittu osana normaalia laadunhallintaa datanhallintasuunnitelmat, jotka huomioivat eri tieteenalojen tarpeet ja tutkimusdatan elinkaaren.”

Data vs. aineisto –termi ? (Kuten aiemmin todettua, koskee koko osalinjausta, sekavuutta esim. myös Strategiset periaatteet: Periaate 3 kohdassa.)
• Datanhallintasuunnitelma vs. Aineistonhallintasuunnitelma
• Datanhallinta vs. Aineistonhallinta
• Tutkimusdata vs tutkimusaineisto
Voidaanko rajautua vain dataan?

“datanhallintasuunnitelmat, jotka huomioivat eri tieteenalojen tarpeet” --> vai niin, että suunnitelmassa otetaan huomioon oman alansa tarpeet?
Muotoilua hyvä vielä hioa.

Avoin saatavuus --> tutkimusdatan avoin saatavuus. Avointa saatavuus hyvä määritellä linjauksessa.

“Vuoteen 2023 mennessä tutkimusorganisaatiot huolehtivat, että opinnäytetöiden ohjaajat osaavat arvioida ja kommentoida datanhallintasuunnitelmia” --> pitäisikö olla korkeakoulut tutkimusorganisaation sijaan?

Osaamisen tukeminen ja jatkuva resursointi? Nykyiset datanhallinnan asiantuntijat ovat erittäin ylityöllistettyjä, ja kansallisella ja organisatorisella tasolla merkittävä haaste onkin, miten huolehdimme kasvavasta erityisosaajien tarpeesta. Tämä edellyttää paitsi asiantuntijaresurssin kasvattamista, niin uudenlaisen osaamisen systemaattista kehittämistä ja tukemista.
Avoimen saatavuuden mahdollistamisen näkökulmasta olennaista on määritellä oikeudet, lisenssit ja ehdot sekä tehdä sopimisesta mahdollisimman selkeää. Toimenpiteet tähtäävät selkeästi konkreettisen ohjeistuksen ja toimintamallin laatimiseen. Myös juridinen näkökulma on tässä olennaista.

Toimenpiteet huomioivat kasvavat osaamistarpeet (moniammatillisuus) ja laajan yhteistyön mahdollistaman potentiaalin toimintamallien ja käytänteiden luomisessa.

Linjauksessa nousee esiin ajatus, että yhteiskunnallinen vaikuttavuus saavutetaan ensisijaisesti lisensoimalla ja kaupallistamalla. Näiden suora rinnastaminen yhteiskunnalliseen vaikuttamiseen vaatii selvennystä. Joidenkin tutkimustuotosten kohdalla kaupallistaminen sopii huonosti tuotoksen luonteeseen. Yhteiskunnallinen vaikuttaminen ei ole vain taloudellista vaan myös kulttuurista, sosiaalista ja poliittista. Ilman kaupallistettua tuotetta voi tutkimustuotoksia hyödyntää varsin laajasti esimerkiksi opetuksessa, julkisessa ja poliittisessa päätöksenteossa sekä kansalaistieteessä. On myös tärkeää, että yhteiskunnallisessa vaikuttamisessa huomioidaan tutkimuksen ja sen tuotosten laatu.

Puhutaan jälleen tutkimustuotoksista --> se olisi tarpeen määritellä sanastossa.
Dokumentointi on olennainen osa aineistonhallintaa, joten sen korostaminen on olennaista. Metadatan tuottamisessa korostuvat kannustimet; monelle tutkijalle asia tuntuu vieraalta ja työläältä. Ehkä tässä voisi painottaa, että on työkaluja, joilla metadataa voi tuottaa. Näin tuodaan esille, että metadatan tuottaminen ei itsessään ja suunniteltuna ole kohtuuton prosessi. Työkalut voisi erottaa omaksi pallukakseen.

Laatuindikaattoreiden ja hyvän datanhallinnan seurannan roolin korostaminen on olennaista.

Tavoitteen alku “Viimeistään vuonna 2024 päättyvissä tutkimus- ja kehittämisprojekteissa...” on merkitykseltään tulkinnanvarainen. Ilmeisesti kuitenkin tarkoitetaan sitä, että viimeistään vuoteen 2024 mennessä kaikissa päättyvissä tutkimus- ja kehittämisprojekteissa.

Hiontaehdotuksia:

Ensimmäinen toimenpide:

Vuoteen 2022 mennessä tutkimusorganisaatiot tukevat tutkijaa metadatan tuottamisessa tukipalveluiden ja kannustimien avulla.

Toinen toimenpide:

Vuoteen 2023 mennessä tutkimusorganisaatiot tarjoavat kattavasti eri kohderyhmille suunnattua koulutusta ja tukea sekä työkaluja tutkimusdatan dokumentointiin huomioiden kohderyhmien osaamisen kehittämisen, eri tieteenalojen tarpeet ja tutkimuksen elinkaaren.

Kolmas toimenpide:

Vuoteen 2023 mennessä tutkimusorganisaatiot tukevat tutkimuksen suunnittelua niin, että tutkimushankkeissa osataan varautua aineistojen dokumentoinnin kustannuksiin.

Neljäs toimenpide:

Vuoteen 2023 mennessä tutkimusorganisaatiot laativat omat hyvän datanhallinnan laatuindikaattorinsa datan hallinnan seurantaan kansallisen tutkimusaineistojen avoimuuden kypsyystasomallin pohjalta.

Pitäisikö tässä kohtaa vielä korostaa, että jatkokäyttö, löydettävyys, yhteentoimivuus ja saatavuus ovat FAIR-periaatteita?
• Saatavuus – vai saavutettavuus? (vrt. esim. https://www.fairdata.fi/tietoa-fairdatasta/fair-periaatteet/)

“Viimeistään vuonna 2024 päättyvissä”: vai tähän vuoteen mennessä?

On ilahduttavaa, että metadata on nostettu linjauksessa esille näin selkeästi. Metadata on edellytys datan jakamiselle ja löydettävyydelle. Dokumentoinnilla voidaan tarkoittaa kuvailua, samoin metadata viittaa kuvaavaan tietoon. Kannattaisiko tavoitteen toimenpidekohdassa 1 puhua paremman selvyyden vuoksi esim. metadatan tuottamisesta. Metadatan dokumentointi --> metadatan tuottamiseen?
Tallennus- ja säilytyspaikkojen systemaattinen kehittäminen sekä kartoittaminen on erittäin olennainen tavoite. Myös tutkijoille vaihtoehdot ovat usein pitkälti tuntemattomia. Infrastruktuurin kehittämisessä tulee huomioida myös siihen tarvittavat resurssit.

“suomalaisessa tutkimusyhteisössä käytettävälle”: käytettävä-sana tuntuu tässä kontekstissa hieman liian rajaavalta sanalta, se jättää huomiotta prosessin, jonka aineiston kokoaminen vaatii sekä sen, että prosessin eri vaiheissa paikkoja voi olla useita.

“Vuoteen 2025 mennessä tutkimusorganisaatiot tuottavat ja tarjoavat em. selvitysten ja suositusten pohjalta tutkijoille ja tutkimusryhmille”: muotoilu tarpeen laajentaa kattamaan muutkin keskeiset ryhmät (kuten opettajat, opiskelijat, TKI-toimijat).

“Vuoteen 2025 mennessä tutkimusorganisaatiot tuottavat ja tarjoavat em. selvitysten ja suositusten pohjalta”: aiemmissa pallukoissa ei puhuta suosituksista, vaan puutteiden kartoittamisesta --> mitä nämä suositukset siis ovat?
Hyvää, että tunnistetaan tarve moniammatilliseen yhteistyöhön sekä datanhallinnan uudet ammatilliset roolit. Datanhallinnan osaaminen on voimakkaasti kehittyvä kenttä, jossa erilaisille ammatillisille profiileille on tarvetta. Erilaisten urapolkujen mahdollistaminen on tärkeää ei vain tutkijoille, vaan myös tukipalveluiden henkilöstölle.

Toinen alakohta (kuvataan) on passiivissa. Kuka on se aktiivinen toimija, kenen vastuulla tämä on? (Meillä on kansallisen AT-koordinaation piirissä Datakoulutukset-työryhmä. Voisiko ehdotuksen laatija olla em. nimetty taho?)

Pitäisikö tavoitteessa itsessään mainita data? Nyt puhutaan vaan yleisemmin uusista ammatillista rooleista, mutta tässä viitataan kuitenkin oletettavasti tutkimusdatan hallinnan uusiin ammattilisiin rooleihin.

“Kehitetään ammatillista koulutusta” --> vai datanhallinnan asiantuntijoiden koulutusta?
Linjauksen päämäärä esitetään napakasti ja selkeästi. Hyvää, että FAIR-periaate nidotaan heti päämääriin. Sen selitys löytyy sanastosta sivulta 7, joten voisiko ajatella jotain lyhyttä käsitteen avaamista jo tässä kohtaa (esim. alaviite?)

Jo linjaustekstin alkupäässä voisi määritellä sitä, kenelle linjaus on suunnattu. Myös koko linjaustekstin alkuosassa (ennen strategisia periaatteita) olisi tarvetta asioiden selkeämmälle kohdennukselle, kenen tulee tehdä tai huomioida jotakin (esim. tutkimusyhteisö, organisaatiot, tutkijat, kansalaistiede).

Linjauksen rakenteen ja taustan voisi nostaa alkuun. Näin heti alussa tulisi selkeästi esiin, että linjauksen alun Johdanto-osuus kontekstoi laajemmin tutkimusaineistojen ja –menetelmien avoimen saatavuuden linjausta ja strategiset tavoitteet liittyvät tutkimusdatan osalinjaukseen ja sen konkreettiisiin toimenpiteisiin.

Verifiointi > arviointi?

Tutkimuksen vapaus ja tutkijan vastuu:

Kappaleessa nostetaan esille tärkeitä asioita kuten vastuullisuus, tasavertaisuus sekä kannustimet. Myös tutkimuksen tekemisen mahdollistavat rakenteet on hyvin huomioitu.

Linjauksessa on hyvää se, että esille on nostettu myös menetelmät tasa-arvoisina aineistojen kanssa, vaikka tällä hetkellä käytännön toimenpiteet ja ohjeistus menetelmien avaamiseksi ei ole vielä kovin selkeää (versus data, jonka avaamiseen on jo luotu runsaasti käytäntöjä ja säilytyspaikkoja jne). [Menetelmiä koskeva osalinjaustyö käynnistyy ko. osalinjaustyön jälkeen/valmistumisen tuntumassa.)

Monessa kohdassa tutkimusaineistoista ja –menetelmistä puhutaan yhtenä kokonaisuutena, joihin pätevät samat asiat ja joihin kohdistuu samoja toimenpiteitä (esim. sekä menetelmille että aineistoille valitaan sopiva repositorio). Tämä ratkaisu vaikuttaa paikoin varsin mekaaniselta.

Menetelmien avaamisesta voisi olla jokin selittävä lause, ts. mitä sillä käytännössä tarkoitetaan (esim. sanastossa).

“Tutkimusyhteisön tulee taata kannustimet.. ” kansallisen tason kannustimet vs. organisaation omat kannustimet? - sivu 3. Muotoilu implikoi, että kannustimien kehittäminen on laajemmin koko tutkimusyhteisön, ei vain organisaatioiden vastuulla (kuten onkin). (Organisatorista, kansallista ja kansainvälistä tasoa ja velvoitetta pohditaan par’aikaa myös EOSCissa.)

“Sen tavoitteena on toteuttaa avoimuus tavalla, joka tukee..” > Olisiko parempi: Sen tavoitteena on tukea avoimuutta ja lisätä tutkijan … ?

Repositorio > arkisto tai säilytyspaikka?

Sivu 4. “Suomalainen tutkimusyhteisö on osa dialogia”... Voisiko selventää?

Kansainvälisyys:
Luonnoksessa esitetyt viittaukset ovat relevantit ja ajantasaiset. Mainittujen dokumenttien keskeinen sisältö voisi olla hyvä olla esitetty tiiviisti.

Riskit ja uhat:
Resursoinnin ongelma on olennainen, joten on erinomaista, että tähän kiinnitetään huomiota.

Resursseja ovat esim. infrastruktuuri (tallennuspalvelut ym.), koulutettu henkilökunta jne.

Huolta herättää, miten nämä tärkeät edistämistoimet rahoitetaan. Toivommekin OKM:n harkitsevan kohdennettua lisärahoitusta tutkimusorganisaatioille mm. tallennus- ja jakoratkaisujen kehittämiselle. Myös osaamisen kehittämisen varmistaminen niin kansallisella kuin organisatorisella tasolla edellyttää nykyistä enemmän toimenpiteitä ja resursoinnin kohdentamista.

Linjauksen rakenne ja tausta:
s. 5 “Linjauksen on laatinut suomalainen tutkimusyhteisö. “ Kun linjauksesta uutisoidaan, siihen kannattaisi liittää menetelmä- ja prosessikuvaus.

Sanasto:
Käsitteitä tutkimusaineisto ja tutkimusdata käytetään sekaisin ja paikoin epäjohdonmukaisesti. Myös metadatan määrittely ei ole täysin selkeää, vaan se määritellään monella eri tavalla.
Strategiset tavoitteet ja toimenpiteet ovat erittäin relevantteja ja ajankohtaisia. Niille asetettu aikataulu on kuitenkin paikoin liiankin kunnianhimoinen, ja toteutus edellyttää merkittävää lisäresursointia niin kansallisten palveluiden kuin tutkimusorganisaatioidenkin tasolla.

Lisäyksenä ehdotamme ei-kaupallisin lähtökohdin tuotettujen palveluiden käyttösuositusta tapauksissa, joissa meillä on tarjota kansallisin ponnistuksin tuotettu kyllin laadukas palvelu tai tekninen infrastruktuuri. On myös tärkeää, että suomalaisella tutkimusyhteisöllä on selkeästi ilmaistu kansallinen tahtotila tuottaa tarvittavia kansallisen tason (kansainvälisesti yhteentoimivia) teknisiä ratkaisuja ja palveluita. Tästä esimerkkinä PASdataan liittyvät palvelut, joiden kehittämisen ja ylläpidon on oltava luotettavalla, taloudellisesti ja aikaa kestävällä pohjalla.

Linjauksessa tulee määritellä riittävän selkeästi, puhutaanko datasta vai aineistosta, ja pitäytyä valitussa kohdennuksessa mahdollisimman systemaattisesti. On erityisen tärkeää, että tämän luonnosversion tapaan hyvä aineistonhallinta ja koulutus nousevat esiin vahvasti läpi linjauksen.

Olisi hyvä kiinnittää huomioita siihen, puhummeko avaamisesta vai jakamisesta, koska ne sisältävät osin eri merkityksiä. Suosisimme enemmän jakamista. Tähän liittyy myös kysymys suljettu-suojattu (as open as possible as closed as necessary), jossa “closed” viittaa usein käytännössä pikemminkin muotoon suojattu. Jakamis-näkökulmaan linkittyy avaamista paremmin myös vastuullisuus olennaisena osana.

Linjauksen kieliasu kaipaa tarkistuksia, mm. anglismeja on tarpeen karsia. Lisäksi terminologinen johdonmukaisuuus on syytä tarkistaa vielä viimeistelyvaiheessa. Tässä tulee ottaa huomioon myös kansainvälinen käytettävyys eli englanninkielisen version sisäinen ja eri kieliversioiden keskinäinen yhdenmukaisuus ja johdonmukaisuus suhteessa kansainväliseen keskusteluun.

Lisäksi
• Linjauksen otsikkoa voisi hieman selkeyttää.
• Linjauksen rakenne ja tausta selitetään verrattain myöhään (sivu 5). Jo alussa voisi tuoda selkeämmin esille linjauksen ja osalinjauksen välisen suhteen. Tekstiä voisi myös yleisesti ottaen napakoittaa.
• Kappaleet tuntuvat irrallisilta, eikä asioita aina sidota tarpeeksi selkeästi yhteen.
• Taustoitus tuntuu verrattain laajalta varsinaiseen sisältöön suhteutettuna.
• Sivulla 10 alaviitteessä annetaan tutkimusyhteisön määritelmä, joka voisi olla nostettuna jo aikaisemmin varsinaiseen tekstiin. Lukijaystävällistä ei myöskään ole ohjata lukijaa toisen suosituksen pariin saadakseen määritelmän selville.
7
Aalto-yliopisto• Osalinjauksessa olisi hyvä kosketella jonkin verran myös sitä, mikä data on relevanttia jaettavaksi ja mikä ei. Tiedämme, että monissa tutkimusprosesseissa syntyy lähes määrättömästi dataa, jota ei ole järkevä säilyttää, tehdä FAIR:ksi ja jakaa. Esimerkiksi Unifin toimenpideohjelmassa https://www.unifi.fi/wp-content/uploads/2019/04/UNIFI_Avoimen_tieteen_ja_datan_toimenpideohjelma.pdf data on jaettu kumuloituvaan, pysyvään ja julkiseen.
• Datan avaamisessa ei kannata pyrkiä täydellisyyteen, muuten esim. vaikeasti avattavat skriptit jäävät täysin avaamatta. On parempi avata se mikä kohtuullisella vaivalla kyetään, hankkia PID ja lisensioida. Mikäli vaaditaan täydellisyyttä, tutkijat eivät vapaaehtoisesti mainitse skriptejä.
• Asianmukaisen tason määrittäminen on haasteellista.
• Itsearviointi auttaa todennäköisesti organisaatioita kehittämään toimintaansa, joten selvityksen pitäisi olla sellainen, että organisaatiot voivat rehellisesti pohtia omia vahvuuksiaan ja heikkouksiaan. Mikäli tulos on rahanjaon perustana, tuloksia todennäköisesti pyritään kaunistelemaan.
• Erittäin tärkeä ja vaikea tavoite, mutta yhteistyöllä on huomattavasti parempi edetä kuin jokainen tutkimusorganisaatio yksin.• Perusopiskelijoihin ja ohjaajiin liittyvä tavoitteet ovat vaikeimmin saavutettavissa ja voivat viedä enemmän aikaa kuin tavoitteissa on esitetty.
• Kansallisesti kannatta kannustaa DMP:iden rekisteröintiin ja julkaisuun. Esim. Open Science Framework sallii jo tutkijoiden ennakkorekisteröidä tutkimussuunnitelman ja DMP:n (kuten eettisen ennakointiarvioinnin).
• Tämä on erinomainen tavoite, sillä yksi suurimpia esteitä avoimuudella on tutkijoiden epävarmuus siitä, voiko dataa avata ja jos voi, miten. Datanhallinnan osaaminen on suhteellisen vähäistä myös juristien keskuudessa, joten heidät pitäisi myös saada aktiivisemmin Avoimen tieteen toimintaa mukaan.
• Tässä pitäisi mainita myös datan käyttösopimukset (silloin, kun dataa ei voi täysin avata, mutta se voidaan kuitenkin jakaa esim. joidenkin tutkimusosapuolien kanssa). Lisenssit ja datan käyttösopimukset ovat eri asioita. (Ks. https://www.ru.nl/rdm/vm/licenses-data-use-agreements/)
• Tekninen huomio: Tavoite 3 on vaikeaselkoisesti otsikoitu. ”Viimeistään vuonna 2024 päättyvissä…” kuulostaa siltä kuin ”vuonna 2020, 2021, 2022, 2023 tai 2024 päättyvissä…” mutta sitä tuskin tarkoitetaan, vaan että viimeistään vuonna 2024 on saatu pystyyn palvelukehikko, jossa otsikossa mainitut asiat toteutuvat. Näinkö asia pitää tulkita?
• Dokumentointi-sanan käyttö tuntuu joissakin kohdissa kummalliselta. Voisiko esim. toiseksi viimeisessä kohdassa puhua datanhallinnan kustannuksista, koska tallennusta koskevassa tavoite 4:ssa ei erikseen mainita kustannuksia?
• Kannattaisiko kirjoittaa vielä selvemmin, että laatuindikaattoreita määritellään yhdessä ja kukin tutkimusorganisaatio voi poimia tästä valikoimasta omat indikaattorinsa?
• Palvelurakenteen kansallinen suunnittelu tulee olemaan tärkeä askel tavoitteiden toimeenpanoa, ja tässä kansallinen yhteistyö esimerkiksi CSC:n koordinoimana on hyödyksi. Palveluekosysteemiä on hahmoteltu jo Unifin toimenpideohjelmassa https://www.unifi.fi/wp-content/uploads/2019/04/UNIFI_Avoimen_tieteen_ja_datan_toimenpideohjelma.pdf• Roolien määrittelyssä tarvitaan kansallista yhteistyötä ja tietojen keruuta. Monissa tutkimusorganisaatioissa on jo henkilökuntaa data-asiantuntijan roolissa, mutta nimikkeet ja työtehtävät vaihtelevat. Tulevaisuudessa tarvitaan entistä enemmän työvoimaa datatukeen.• Lähes jokaisessa kohdassa aloitetaan "tekemällä selvitys" ja tekijänä on Avoimen tieteen koordinaatio. Käytännössä tekijät ovat ne tutkimusorganisaatioiden edustajat, jotka osallistuvat asiantuntija- ja työryhmiin oman työnsä ohella. Koordinaatioon ja selvityksiin tarvitaan lisää resursseja. Liitteen 1 toimenpiteiden aikajana on erinomainen liite ja tekee näkyväksi kaiken työn, jota pelkästään tämän linjauksen toteuttaminen vaatii.
• Kannattaa tehdä vielä selvemmäksi, että tämä linjaus esittää yleiset periaatteet ja osalinjauksen datan osalta, ja että toinen osalinjaus koskien menetelmiä tulee myöhemmin.
• Esimerkiksi Unifin avoimen tieteen ja datan toimenpideohjelma esitti jo vuoden 2018 lopulla https://www.unifi.fi/wp-content/uploads/2019/04/UNIFI_Avoimen_tieteen_ja_datan_toimenpideohjelma.pdf kaksi konkreettista osatavoitetta: (1) tukipalvelut tarjotaan läheltä, ja paikalliset tukipalvelut hyötyvät kansallisesti koordinoiduista ratkaisuista. (2) Suomessa käytettävät toimintatavat ja standardit ovat yhteensopivia kansainvälisten kanssa. Suomalainen tiedeyhteisö sekä seuraa kansainvälistä kehitystä että näyttää sille suuntaa. – Nämä kaksi konkreettista tavoitetta olisi hyvä saada näkyviin nykyiseen osalinjaukseen.
• Samaten Finnish Committee for Research Data (FCRD) julkaisi keväällä 2018 tiekartan datasitaatiomenetelmien jalkauttamiseksi https://www.doria.fi/bitstream/handle/10024/153328/Tracing-Data-Finnish-Committee-for-Research-Data.pdf?sequence=1&isAllowed=y Tätä konkretiaa toivoisimme myös näkyviin osalinjaukseen.
• Sekä Unifin että FCRD:n vuoden 2018 tavoitepaperit ovat nykyisen osalinjauksen lähdeviitteissä, mutta niihin ei ole edes viitattu kovin selvästi, saati että niissä tehtyä konkretiaa olisi nostettu dokumenttiin mukaan.
• Sivulla 6 esitetyssä sanastossa ”tutkimusdata” on määritelty aineistoksi, joka voi olla digitaalisessa, analogisessa tai fyysisessä muodossa. Voisiko sanamuoto olla ”yleensä digitaalisessa, mutta harvinaisemmissa tapauksissa myös analogisessa tai fyysisessä muodossa”?
• Tutkijan näkökulmasta linjaus ei vaadi toimenpiteitä tutkijoilta, vaan sen sijaan tutkimusorganisaatioilta vaaditaan toimia ja palveluja.
• Tutkimusyhteisö kannattaa nostaa sanastoon, nythän vain viitataan avoimen tieteen julistukseen.
• Linjauksessa on hienolla tavalla tavoitettu ja sanoitettu ylätason toivekuva, miten tutkimusdatan avointa saatavuutta edistetään. On ansiokasta, että sellainen dokumentti on myös suomeksi. Ajatuksia herättää kuitenkin, voisiko paperi olla konkreettisempi. Tavoitteita on linjattu jo monien vuosien ajan sekä Suomessa ATT-hankkeessa ja Unifin avoimen tieteen ja datan toimenpideohjelmassa, että monissa kansainvälisissä yhteyksissä. Onko meillä vielä tarvetta ylätason tavoitteiden linjauspaperille, vai voisimmeko esittää samalla jo konkretiaa? Esimerkkejä konkretiasta on tässä lausunnossamme.
8
Itä-Suomen yliopisto”Vuoteen 2023 mennessä tutkimusorganisaatiot sisällyttävät datanhallintasuunnitelman laadinnan ja ylläpidon osaksi tutkimus- ja palveluprosesseja aineiston elinkaaren jokaisessa vaiheessa.” Tällä hetkellä DMPTuuli ei suoraan mahdollista ns. dynaamisia DMPtä jotka toimisivat osana organisaation tutkimus- ja palveluprosesseja, miten saadaan DMPt oikeasti käyttöön niin että ne näkyvät ajantasaisina kaikille datatuen työhön osallistuville ja niitä todella hyödynnetään datatuessa/palveluissa?

”Korkeakoulut sisällyttävät datanhallinnan koulutuksen opetussuunnitelmiin perus- ja jatkokoulutuksessa.” Tämä edellyttää korkeakouluissa resurssointia ja Opetussuunnitelmatyötä, joten aikataulutuksen kanssa voi tulla haasteita korkeakoulujen opetussuunnitelmatyön prosesseiden kanssa.
Ensimmäinen ja toinen luettelomerkki, ovatko aikataulullisesti synkronoitu keskenään?
Lisenssointiasia pitäisi saada jotenkin selkeämmin avattua tai tarkennettava avoimiin tutkimusdatoihin.
Tarkoitetaanko tässä organisaatioiden omia kannustimia vai jotakin muuta? Kuinka yleisesti huomioidaan tutkijan meritoituminen?Ammatillisen koulutuksen kehittäminen: mitä tarkoittaa ammattikoulujen kehittäminen?
sama täsmennys ammatillisiin rooleihin. Kysymyksessä on datanhallinnan koulutuksen kehittäminen ja datanhallinnan roolit
Tutkimusaineistolle ja -menetelmille valitaan sellainen repositorio, joka parhaiten sopii kullekin aineistotyypille.
muutetaan muotoon: ”Tutkimusaineistolle ja -menetelmille valitaan sellainen repositorio, joka parhaiten sopii kullekin aineistotyypille ja tarjoaa FAIR-periaatteiden mukaisen palvelun.”

Sanasto
FAIR-periaate-osiota voisi täydentää lauseella:
”FAIR-periaatteiden noudattaminen edellyttää julkaisuarkistoilta/repositorioilta erilaisten teknisten valmiuksien tarjoamista.”

Aikataulut voisi kirjoittaa selvästi vuoteen mennessä, vuoden aikana, ettei niihin jää tulkintaa.
Aikataulut ovat yleisesti kunnianhimoisia, mutta se voi olla positiivistakin, että saadaan asiat etenemään.
Haasteena opinnäytetöiden ohjaajien kouluttaminen, jolloin koskee suurta joukkoa yliopistossa tehtävää työtä.
9
TaideyliopistoTaideyliopisto kannattaa periaatetta ja pitää kuvausta toteutumisen varmistamisesta ja seurannasta mielekkäänä.Taideyliopisto pitää aikataulua kunnianhimoisena. Tutkimusorganisaation näkökulmasta olisi tärkeää tietää, mitä vuonna 2021 toteutettava tason määrittely käytännössä tarkoittaa. On kannatettavaa, että lähtötason kartoitus ja seuranta toteutetaan yhteistyössä tutkimusorganisaatioiden kanssa, mutta työhön vaadittava resurssi tulee huomioida organisaation toiminnan suunnittelussa.Datan avaamisen vaivattomuus vaihtelee alakohtaisesti. On huolehdittava siitä, että tutkimusdatan avaamisen vaikutus meritoitumiseen ei saata tutkijoita eriarvoiseen tilanteeseen.Taideyliopisto ilmaisee huolensa toteutuksen kunnianhimoisesta aikataulusta. Käytännön toteutus vaatii organisaatioilta resursseja. Mikäli organisaatiolla ei ole vaadittavia resursseja turvata palveluita, se vaikuttaa tutkijoiden asemaan ja kilpailukykyyn.Taideyliopisto ilmaisee huolensa toteutuksen kunnianhimoisesta aikataulusta. Käytännön toteutus vaatii organisaatioilta resursseja. Mikäli organisaatiolla ei ole vaadittavia resursseja turvata palveluita, se vaikuttaa tutkijoiden asemaan ja kilpailukykyyn.Taideyliopisto ilmaisee huolensa toteutuksen kunnianhimoisesta aikataulusta. Käytännön toteutus vaatii organisaatioilta resursseja. Mikäli organisaatiolla ei ole vaadittavia resursseja turvata palveluita, se vaikuttaa tutkijoiden asemaan ja kilpailukykyyn.

Linjauksessa pitkäaikaissäilytyksen käytännöt jätetään avoimiksi: missä ja kuinka pitkään aineistoja säilytetään. Taideyliopiston näkökulmasta on oleellista, mitä tehdään konkreettisille artefakteille, joita ei voida digitalisoida.
Taideyliopisto ilmaisee huolensa toteutuksen kunnianhimoisesta aikataulusta. Käytännön toteutus vaatii organisaatioilta resursseja. Mikäli organisaatiolla ei ole vaadittavia resursseja turvata palveluita, se vaikuttaa tutkijoiden asemaan ja kilpailukykyyn.

Linjauksessa pitkäaikaissäilytyksen käytännöt jätetään avoimiksi: missä ja kuinka pitkään aineistoja säilytetään. Taideyliopiston näkökulmasta on oleellista, mitä tehdään konkreettisille artefakteille, joita ei voida digitalisoida.
Taideyliopisto ilmaisee huolensa toteutuksen kunnianhimoisesta aikataulusta. Käytännön toteutus vaatii organisaatioilta resursseja. Mikäli organisaatiolla ei ole vaadittavia resursseja turvata palveluita, se vaikuttaa tutkijoiden asemaan ja kilpailukykyyn.Taideyliopistossa tehdään tieteellisen tutkimuksen lisäksi myös taiteellista tutkimusta. Taideylipistossa käytetään ”tieteen” sijaan termiä ”tutkimus”. Taideyliopisto esittää, että tämä huomioidaan linjauksessa.

s. 4: ”hyvien tieteellisen käytäntöjen” (kirjoitusvirhe) -> voisi olla ”hyvän tieteellisen käytännön”, joka on vakiintunut termi.

Aineiston käsite taiteellisessa tutkimuksessa ei ole yksiselitteinen. Taideyliopistoissa tehtävään tutkimukseen voi sisältyä taiteellisia osuuksia. Näiden asema tutkimuksessa on moninainen: ne ovat osa tutkimusprosessia, metodia, aineistoa tai tutkimuksen lopputulema.

s. 6: Sivulla 6 puhutaan aineiston lisensoinnista, mutta siinä yhteydessä ei mainita tekijänoikeuksia. Taiteellisessa tutkimuksessa on usein välttämätöntä sulkea taiteelliseen osuuteen kuuluvat teokset ”All rights reserved” -lisenssimaininnalla. Tällöin tekijänoikeuden haltija pidättää kaikki oikeudet itsellään. Lisäksi ilmaisu ”on voitu” -> voisi muuttaa muotoon ”voidaan rajoittaa/rajoitetaan”.

S. 7 maininta koneellisesti löydettävistä ja luettavista aineistoista. Taideyliopistossa tutkimusmateriaali saattaa olla esimerkiksi kuvia jne. Tällaisen aineiston kuvaus metadatana on mahdollista, mutta itse dataa ei pääsääntöisesti voida koneellisesti lukea tai tunnistaa.

Voivatko periaatteet liian tiukasti tulkittuina rajoittaa ja ohjata sitä, millaisia aineistoja käytetään ja sitä kautta myös sitä, mitä ylipäätään uskalletaan tutkia ja millaisia kysymyksiä esittää.

Esimerkiksi mikäli FAIR-periaatteisiin kuuluva yhteensovitettavuus merkitsee sitä, että tutkimusdatan pitää olla löydettävissä ja luettavissa koneella, ohjaako se tutkijoita käyttämään helposti digitoitavissa olevia aineistoja vaikka ne eivät tutkimuksen sisällön ja laadun kannalta olisi ensisijaisia?

S. 7 virke: ”Tämä puolestaan Vastuullinen aineistonhallinta edellyttää tutkimusaineistojen, tutkimusdatan ja metatietojen tietoturvallista, tietosuojan mukaista ja tutkimuseettisesti kestävää hallintaa.” (typo; ei ymmärrettävä)
10
Svenska HandelshögskolanUnder Princip 1 borde det klargöras mera specifikt vad som avses med ansvarsfull hantering av forskningsdata (dvs. utgå inte ifrån att läsaren kommer ihåg definitionen av ansvarsfull datahantering från de tidigare sidorna, utan nämn i denna punkt på nytt åtminstone persondataskydd samt iakttagande av disciplinens natur och krav för ansvarsfullheten). Man bör också beakta disciplinens natur och följa riktlinjer enligt dess Ethics Board.Om man använder begreppet ”på ett forskardrivet sätt”, borde det definieras mycket klarare vad det betyder, t.ex. i relation till förlagens tjänster. Dessutom borde man poängtera att ”som huvudregel baserar sig utvecklingen av infrastruktur och service inte på den service som enskilda förlag/företag säljer, utan utvecklingen drivs huvudsakligen av vetenskapliga samfundet självt”.Forskningsdata kan i vissa fall vara svårt att definiera, ha en amorf form eller det kan finnas olika nivåer av data. Hur definiera forskningsdata så att det kan beaktas i meriteringskriterierna, t ex i discipliner där ”data” innehåller främst litteraturmaterial eller kvalitativa material, eller är icke-empiriska? Data, och hur man kan öppna det för användning, varierar i olika discipliner. Det är viktigt att observera också skydd av persondata (inte enbart tekniskt).Mål 1 borde komprimeras för att fokusera på det man vill uppnå (t.ex. stryka de två sista meningarna, och som målformulering ha: ”Senast år 2023 har alla forsknings- och utvecklingsprojekt som inleder sin verksamhet datahanteringsplaner som en del av normal kvalitetsledning.”) Här borde man också definiera vilka forsknings- och utvecklingsprojekt som avses (t.ex. studerandes forskningsprojekt ingår inte?).

Finns det en konflikt mellan öppenhet och att garantera en så bra kvalitet som möjligt på forskningen? Kutymen är olika inom olika discipliner.
Den första meningen är formulerad mera som en åtgärd än som ett mål. Den andra meningen är formulerad som ett mål. Således borde Mål 2 fokusera enbart på: "Senast år 2023 ges alla öppet tillgängliga forskningsdata ges licenser som reglerar delning och återanvändning”.

Frågan om licenser innehåller många oklarheter ur juridisk synvinkel, borde klargöras (t.ex. vem har rätt att utfärda en licens. Som en åtgärd borde det skapas verksamhetsmodeller/riktlinjer enligt vilka organisationen/forskaren kan agera).
Är det tillräckligt att ha gjort en DMP i början av projektet, och vid slutet av projektet konstatera att man har följt DMP-planen, också med dokumentationen? Eller bör man alltid skapa en skild dokumentation som offentliggörs? Detta kunde klargöras.Begreppet yrkesroller är vagt formulerat. Detta mål låter mera som en åtgärd. Kunde detta mål således placeras in som en åtgärd under någon av de övriga målen i stället för att stå som ett separat mål?
11
Jyväskylän yliopistoPeriaate antaa erinomaisen lähtökohdan suositukselle. Lisäksi periaatetta edeltävät määritelmät antavat tarkan kuvan sille, mitä vastuullisella aineistojen avaamisella tarkoitetaan.Tutkijoilla on oltava käytettävissään ne aineistonhallintaan liittyvät palvelut, joita he tutkimuksessaan kullakin hetkellä tarvitaan. Yhteistä kansainvälisiä malleja noudattavaa ja kansallisesti laadittua kypsyystasomallia tarvitaan, jotta tutkimusorganisaatiot voivat yhdenmukaistaa palveluitaan. Avoimen tieteen koordinaatio määrittelijänä, tutkimusorganisaatiot kypsyystason itsearvioinnin toteuttajana ja Opetus- ja kulttuuriministeriö arvioijana on hyvin määritelty toimijavastuiden ketju. Kypsyystason itsearvioinnin hyödyntämisaikataulussa täytyy huomioida eri toimijoiden valmius sen toteuttamiseen ja raportointiin.Periaate avoimuuden eri näkökulmista tutkijan meritoitumiskriteereinä on erittäin kannatettava. Lähtötilanteen kartoitus ja sen pohjalta tehtävät suositukset Avoimen tieteen koordinaation toteuttamana on erittäin tarpeellisia tutkijoiden yhdenmukaisen arvioinnin kannalta.Datanhallintasuunnitelmat ovat jo nyt tärkeä osa monien tutkimushankkeiden valmistelua ja toteuttamista. Tutkimusorganisaatioiden on määriteltävä omat aineistojen hallintaan liittyvät yleiset periaatteensa ja tarjottava niiden mukaiset palvelut. Monet rahoittajat ovat edistäneet aineistojen hallintaa ja aineistojen avaamista omilla vaatimuksillaan. Tutkimus- ja opetusyhteisön kannalta toimenpide, jossa opinnäytetöiden ohjaajat osaavat arvioida ja kommentoida datanhallintasuunnitelmia vuoteen 2023 on sinänsä kannatetta. Toimenpiteen aikataulu on erittäin haastava, jos opinnäytetöillä tarkoitetaan kaikkien tutkintotasojen opinnäytteitä. Sama aikataulu seuraavassa toimenpiteessä, jossa edellytetään varautumista datanhallinnan ja sen tuen kustannuksiin, on myös haastava ja välttämättä tutkimusorganisaatioilla tai kaikilla rahoittajilla ei tule olemaan vielä valmiuksia kustannuksiin vastata.Tavoite 2 toimenpiteineen tutkimusdatan käyttöön liittyvistä oikeuksista, ehdoista ja lisensseistä on välttämätöntä saada kansallisesti yhtenäisesti sovittua mahdollisimman nopeasti. Tutkimusorganisaatiot tarjoavat varmasti parhaansa mukaan jo tällä hetkellä erikoistapauksiin liittyvää neuvontaa ja opastusta, joskin ilman yhtenäisiä toimintatapoja ja esimerkiksi jatkokäytön määrittävistä lisensseistä sopimista työtä tehdään monin tavoin soveltaen ja toiminnan yhtenäisyys puuttuu. Tämä vaikuttaa esimerkiksi organisaatioiden yhteisten tutkimushankkeiden toteuttamiseen ja niiden aineistojen hallintaan.Tavoitteessa 1 tavoitellaan, että vuonna 2023 kaikki aloittavat tutkimusprojektit hallitsevat tutkimusdatansa. Tässä tavoitteessa asetetaan vaatimus sille, että vuonna 2024 päättyvissä projekteissa tutkimusdata on hallittua ja tutkimusdatan jatkokäytöstä ja saatavuudesta on huolehdittu. Aikataulut ovat ristiriitaiset, sillä monet tutkimushankkeet, jotka päättyvät vuonna 2024 ovat jo alkaneet ja niiden tutkimusaineistojen hallinta ei välttämättä täytä kaikkia avoimuuden vaatimuksia ja sen vuoksi tätä toimenpidettä on syytä muotoilla uudelleen. Muutoin esitetyt toimenpiteet tutkimusdata metadatan dokumentoinnista ohjeistuksiin ja kustannuksista huolehtimiseen ovat aikatauluineen hyvin suunniteltu. Avoimuuden kypsyystason indikaattoreiden valmistelu vuoteen 2023 mennessä kytkee osalinjauksen hyvin yleisempiin periaatteisiin.Tutkimusdatan säilyttäminen tieteenalan tarpeet huomioiden on tärkeä osa sekä palveluille että tutkimusinfrastruktuureille osuvia vaatimuksia. Toimeenpanoon varattu aika vuoteen 2025 on kohtuullinen.Tavoitteen toimenpiteiden mukaisesti tutkimusaineistojen käsittely ja hallinta kannattaa tehdä yhdenmukaisesti kautta tutkimusyhteisön ja sen vuoksi yhteistyön korostaminen on tärkeää. Aineistojen käsittelyn näkökulmasta tutkimuksessa ja tutkijoilla on paljon tarpeita aineistoihin ja metodologiaan liittyen. Mahdollisia uusia ammatillisia rooleja voivat olla vaikkapa aineistokoordinaattorit, -kuraattorit ja "datatalkkarit", jotka huolehtivat yhdessä tutkijoiden kanssa heidän ja tutkimusorganisaatioiden aineistoista myös sen jälkeen, kun yksittäiset tutkimushankkeet ovat päättyneet.Luonnos kokonaisuudessaan määritelmineen ja lähteineen on varsin kattava ja huolellisesti valmisteltu. Toimeenpanoa helpottaa selvästi liite 1:seen koottu eri toimenpiteiden aikajana vuosille 2021-2025. Sen avulla tavoitteet ja toimenpiteet nivoutuvat selkeästi yhteen.
12
Vaasan yliopistoMiten yliopistoja tuetaan, että voidaan varmistaa aineiston avaamiseen vastuullisuuden periaatteen toteutuminen? Tuleeko lähtötilanteen kartoitukseen ja seurantaan kansallinen kysely? Sen perusteella kansallista tukea per yliopisto?Asianmukainen tason määrittelyssä otettava huomioon myös pienempien yliopistojen mahdollisuudet omien palveluiden kehittämiseen. Itsearviointimallin kehittäminen yliopistojen käyttöön hyvä, mutta se voisi tulla jo aiemmin, että voimme peilata jo nyt palveluiden kehittämistä ja kohdentamista tälle alueelle.Vaatii muutoksia yliopiston omiin käytänteisiin mm. erilaisissa arvioinneissa ja tulosten mittaamisissa, miten tieto kerätään? Tenkin cv mallin muutos?Tutkijoiden kannalta olisi todella tärkeää, että aineistonhallinnan järjestelmät olisivat mahdollisimman yksinkertaisia ja kaavamaisia niin, että tarvittavat tiedot olisi mieluimmin rasti ruutuun -periaatteella valittavissa valmiista nettilomakkeesta ja että myös vapaamuotoisesti täytettävät kohdat olisivat pitkälti standardi-ilmauksilla esitettäviä.

Hienoa on, että tässä edetään vastuullisuus-teemalla läpi linjauksen.

Hyvä myös, että osaamisen ja palveluiden rakenteita ja sisältöjä kehitetään kansallisessa ja kansainvälisessä yhteistyössä. Millaista tukea saatavilla yksittäiselle organisaatiolle? Kuka maksaa? Koska yhteinen hanke, niin yhteisiä koulutuksia, infoja, palveluita, tukitoimintoja valtakunnallisesti. Linjausten jälkeen ei saa jättää yliopiston yksin asian kanssa, vaan pitää miettiä mm. valtakunnallisia palveluita ja yhdessä alakohtaisia parhaita tapoja avaamiselle.

Seuranta tulee olla reilu kaikille organisaatioille, on erilaisia kypsyystasoja mm. palveluiden laadussa.

Avaamatta jättäminen edellyttää aina perusteluja: Tämä on iso kulttuurinen muutos: vaikka päätös kuuluukin tutkijalle, pitää valinta perustella.

Täysin FAIR-periaatteiden mukainen data ei ole vielä useimmilla aloilla mahdollista osaamisen ja palveluiden puutteista tai datan luonteesta johtuen: Tämä huomio on hyvä lisäys, tilanne on kehittymässä.
13
Helsingin yliopistoHyvä tieteellinen käytäntö on käsitteenä vanhempi ja vakiintuneempi kuin vastuullisuus, eikä ole kaikille lukijoille välttämättä itsestään selvää, että hyvään tieteelliseen käytäntöön lasketaan nykyisin myös tietosuojalainsäädännön huomioiminen. Tämä tulisi selventää jo linjauksen johdanto-osassa. HTK-ohjeet eivät yksinään riitä sen ymmärtämiseen, millaisia toimenpiteitä tutkimusdatan vastuullinen avaaminen vaatii, sillä kyse on ketjusta, jossa monta toimijaa tutkijan itsensä lisäksi. Kaikilta toimijoilta tulisi edellyttää vastuullisuutta. Periaatteiden pukeminen passiivimuotoon hämärtää tätä entisestään.Helsingin yliopisto kannattaa organisaatioiden datanhallinnan kypsyystasomallin kehittämistä. Mutta mitä konkreettisesti tarkoitetaan tutkijalähtöisyydellä? Infrastruktuuri ei ole vain teknologiaa, vaan se edellyttää aina myös palveluita ja moniammatillista osaamista. Organisaatiokohtaisten palveluinfrastruktuurien käyttäjinä ovat useat eri tieteenalat, jolloin niiden kehittäminen tutkija- tai tutkimuskohtaisesti räätälöiden on usein mahdotonta.Tutkimusdatan avoimen saatavuuden edistämisessä on olennaista, että tutkijan aineistoihin liittyvä työ huomioidaan meritoitumisessa. Meritoitumisen mittareita ja tietopohjaa kehitettäessä tulee kuitenkin huolehtia, että tutkimusaiheet eivät aseta tutkijoita eriarvoiseen asemaan.Tavoite sisältää kannatettavan periaatteen, jonka mukaisesti datanhallintasuunnitelman laatimisen tulee olla osa normaalia tutkimuksen suunnitteluprosessia, sekä ottaa huomioon sen, että tavoitteen toteutuminen edellyttää organisaatioiden järjestämää laaja-alaista koulutusta. Toimenpiteissä ei kuitenkaan sanallisteta tutkijoiden vastuuta lainkaan. Esim. toimenpiteessä ”Vuoteen 2023 mennessä tutkimusorganisaatiot sisällyttävät datanhallintasuunnitelman laadinnan ja ylläpidon osaksi tutkimus- ja palveluprosesseja aineiston elinkaaren jokaisessa vaiheessa” (s.11) datanhallintasuunnitelman laatimisen ja päivittämisen (ei yllä pitämisen) velvoite koskee nimenomaan tutkijaa. Sisältyykö toimenpiteeseen myös ajatus siitä, että suunnitelmaa olisi päivitettävä joka kerta, kun tutkimusdatan käsittelyssä siirrytään uuteen vaiheeseen? Tätä olisi hyvä tarkentaa.

Koulutuksen osalta (1. toimenpide) tavoitteen toteutuminen edellyttää yhteistyötä organisaation tukipalveluiden sekä tutkimusalojen ja koulutusohjelmien välillä. Tällainen erilaisille yleisöille räätälöity koulutus on tavoitteiden saavuttamisen kannalta olennaista, mutta sitoo huomattavasti henkilöresursseja. Siihen nähden tavoitteen aikataulu on liian optimistinen. Tavoitteen 4. toimenpide (datanhallinnan ja sen tuen resurssit) tulee sen sijaan myöhään suhteessa muihin toimenpiteisiin: toiminnan kehittämisen kannalta olemassa olevien ja vaadittavien resurssien kartoituksen tulisi olla ensisijaista. Osalinjauksessa tulisi edellyttää organisaatioilta myös ajantasaisia datapolitiikkoja.
Yhteisten toimintamallien luominen tutkimusdataan liittyvien oikeuksien, ehtojen ja lisenssien sopimiseksi on tärkeää. Tutkimus ja tutkimusryhmät ovat kuitenkin usein kansainvälisiä; pelkkä kansallisten ratkaisujen etsiminen ja luominen ei yksin riitä. Tarvitaan juridista tukea sopimusehtojen laadintaan yli kansallisten rajojen. Miten varmistetaan, että datan keräävät tutkijat ovat mukana näiden toimintamallien suunnitteluprosessissa?

Tutkimusdataan liittyvien juridisten kysymysten neuvontaa annetaan nykyisin paljon kirjastoissa, yhteistyössä organisaation juristien kanssa. Osaavien kirjastolaisten ohella tarvitaan tutkimusdatan hallintaan perehtyneitä juristeja, ja jatkokouluttautumisen tarpeita on kaikilla toimijoilla.
Erittäin tärkeä tavoite. Ensimmäisen toimenpiteen ”metadatan dokumentoitiin” (s. 12) tulisi olla muodossa ”tutkimusdatan dokumentointiin”, koska siihen viitataan myös itse tavoitteessa. Toimenpiteissä olisi hyvä ottaa kantaa myös siihen, miten itse tutkimusdatan laadunvalvonta varmistetaan.Tavoite 4 pohjustaa kaikki muita tavoitteita: tutkijoiden kouluttaminen ja ohjaaminen toimimaan tiettyjen suositusten mukaan on hyödytöntä ja tutkijayhteisöä turhauttavaa, elleivät palveluinfrastruktuurit ole kunnossa. Tavoite sitoo yhteen useamman tason toimijoita. Toimenpiteissä mainittu selvitystyö on tärkeää, mutta se vaatii itsessään resursointia, sen tulokset on koottava yhteisesti, ja jos paljastuu suuria ongelmia, niiden ratkaisemiseksi tarvitaan lisää resursseja. Ratkaisuja tarvitaan organisaatiotasolla, ei pelkästään kansallisesti. Erityisesti yliopistoilla täytyy olla toimiva datanhallinnan palveluinfrastruktuuri, jotta tutkimuksen aikainen aineistojen tallennus onnistuu.Datanhallinnan tavoitteiden saavuttaminen organisaatiotasolla edellyttää myös uudenlaisten tutkimusdataan liittyvien ammatillisten roolien huomioimista akateemisessa yhteisössä. Tätä kansainvälistäkin kehitystä tulisi sanoittaa linjauksessa hiukan tarkemmin, sillä “ammatillinen koulutus” (s. 13) luo herkästi mielikuvan esim. datanomin koulutuksesta, mikä on tässä yhteydessä harhaanjohtavaa. Tutkimusdatan hallinta on monipuolista asiantuntemusta vaativa työkenttä: se edellyttää ylempää korkeakoulututkintoa ja tieteenalaosaamista, kuten tutkimusmenetelmien syvällistä tuntemusta.

Tavoitteen ensimmäinen toimenpide (koulutus) on tullut kuvattua jo aiemmin, joten sen voisi jättää pois.
On tärkeää, että linjauksessa on otettu huomioon kansainvälinen konteksti. Olisi kuitenkin hyvä selittää hiukan enemmän tekstissä mainittuja EU-tason keskeisiä dokumentteja. Millaisia asioita niissä painotetaan? Kannattaa myös merkitä kyseisen tekstikohdan viitteet johdonmukaisesti, eli englanninkielisen dokumentin nimi leipätekstiin tai alaviitteeseen sellaisenaan, koska lähdeluettelon ja viitteiden tulee viitata saman nimisiin dokumentteihin. Myös edeltävästä kansallisesta työstä tutkimusdatan avoimuuden edistämiseksi olisi hyvä mainita jotain. EOSC ei ole ainoastaan yhteisö, kuten teksti antaa ymmärtää, vaan ennen kaikkea eurooppalaisten tutkimusdatainfrastruktuurien ja palveluiden yhteenliittymä. Suomalainen tutkimusyhteisö ei ole ”osa dialogia” (s. 4), mutta se voi olla mukana dialogissa, jonka tuloksena luodaan toimivia ratkaisuja ja jossa omaksutaan parhaita käytäntöjä.

On erittäin hyvä asia, että linjausluonnoksessa on käsitelty myös tutkimusaineistojen ja -menetelmien avaamiseen sisältyviä riskejä ja uhkia. Kuvausta voisi kuitenkin vielä tarkentaa, sillä pelkkä ”juridiset kysymykset” (s. 4) ja viittaus tutkijoiden huoleen ei avaa asiaa riittävästi. Tutkimusrahoittajat eivät tällä hetkellä edellytä tutkimusmenetelmien avaamista, ja vain osa edellyttää tutkimusdatan avaamista, joten tämä kohta pitäisi muotoilla uudelleen. Tutkimusorganisaatioiden kannalta riskinä on se, että käytettävissä olevat resurssit eivät riitä datanhallinnan tavoitteiden toteuttamiseen; myös tämä näkökulma on syytä tuoda mukaan.

Sanasto on tämänkaltaisessa linjauksessa erittäin tarpeellinen, sillä tutkimusdataan liittyy paljon erikoissanastoa, jonka käytetyimpien termien tunteminen on välttämätöntä kaikille aiheen parissa työskenteleville – ammattinimikkeestä riippumatta. Sinänsä hyvin laaditussa sanastossa on kuitenkin eräs merkittävä terminologinen epäselvyys, joka haittaa ymmärrettävyyttä: tutkimusaineiston (research material) ja tutkimusdatan (research data) keskinäinen erottelu. Määritelmien – joiden lähdettä ei ole annettu – mukaan tutkimusdata ”on tutkimusaineistoa, joka on kerätty, havaittu, mitattu tai luotu tutkimustulosten todentamiseksi. Tutkimusdata voi olla digitaalisessa, analogisessa tai fyysisessä muodossa (esimerkiksi laboratoriopäiväkirjat)” (s.6). Edelleen, tutkimusaineisto on edellistä laajempi käsite, joka tarkoittaa ”digitaalisessa, analogisessa tai fyysisessä muodossa olevaa tieteellisen tutkimuksen perusaineistoa” (s.6). Käsillä olevassa dokumentissa ei kuitenkaan missään muussa yhteydessä viitata analogisiin tai fyysisiin aineistoihin. Kaikki kuvatut strategiset periaatteet, tavoitteet ja toimenpiteet viittaavat digitaalisiin aineistoihin (fyysiset aineistot, kuten mainitut laboratoriopäiväkirjat, ovat tulevaisuudessa myös yhä useammin digitaalisia). Linjauksen kohteen ja kohteen määrittelyn välillä vallitsee siis selvä epäsuhta.

Kansallisen tason linjauksessa, jonka julkilausuttuna tavoitteena on edustaa yhteistä näkemystä tutkimusaineistojen ja -menetelmien avaamisesta, myös keskeisen sanaston tulisi olla selkeää ja mahdollisimman yksiselitteistä. Siksi onkin yllättävää, kun linjausluonnoksessa todetaan seuraavasti: “Tieteenalojen erilaisuudesta johtuen, vakiintunutta sanastoa ei tule koskaan syntymään ja jokainen aihetta käsittelevä joutuu määrittelemään käyttämänsä termit parhaaksi katsomallaan tavalla”(s.5). Vaikka täyttä yhtenäisyyttä käytetyssä sanastossa ei koskaan saavutettaisi, kansallisen ja kansainvälisen yhteentoimivuuden ja yhteistyön vuoksi on kuitenkin pyrittävä siihen, että käytetyistä käsitteistä vallitsee riittävä yhteisymmärrys. Sanaston vakiintumista edistetään termien johdonmukaisella käytöllä.

Sanaston kohdassa ”Tutkimusdatan hyvä ja vastuullinen hallinta” todetaan seuraavaa (s.7): “Avaamatta jättäminen edellyttää aina perusteluja.” Missä perustelut on tarkoitus ilmoittaa? Tätä voisi tarkentaa. Perusteluiden vaatimisessa on riskinä myös tutkijan ja hallinnollisen työn lisääntyminen.

Ehdotuksia sanastoon lisättävistä termeistä: repositorio, infrastruktuuri, tutkimusdatan elinkaari
Helsingin yliopisto pitää erittäin kannatettavana yhteisten periaatteiden ja tavoitteiden laatimista tutkimusdatan ja -menetelmien avaamiselle. Monet tutkimusdataan ja muihin tutkimustuotoksiin liittyvät hankkeet, linjaukset ja palvelut ovat Suomessa vasta kehitysvaiheessa, jolloin yhteisten pelisääntöjen laatimiselle on ilmeinen tarve. Seuraavassa esitetyt huomiot ja kommentit on koottu sekä Helsingin yliopiston tutkimuksen johdolta tiedekunnista että tutkimusdataan liittyvistä tukipalveluista, ja ne on tarkoitettu tukemaan osalinjauksen käytettävyyttä ja sovellettavuutta tutkimusorganisaation näkökulmasta.

Tästä syystä ensimmäinen kommentti koskee käsillä olevan dokumentin kohdeyleisöä. Dokumentin alussa esitetyt strategiset periaatteet sekä myöhemmin tutkimusdatan avoimuutta koskevat tavoitteet ja toimenpiteet koskevat kaikki tutkimusorganisaatioita. Vaikka dokumentissa mainitaan erikseen tutkijan vastuu (s. 3), niin organisaatiot viime kädessä tuottavat tutkimusdatan avoimuutta tukevat kannustimet ja rakenteet. Linjauksessa tulisi selkeämmin kertoa se, kenelle se on suunnattu: nyt tekstissä usein käytetty ”tutkimusyhteisö” hämärtää käsitystä siitä, mikä taho on vastuussa tavoitteiden toteuttamisesta. Vastuiden epäselvyys lisää myös riskiä päällekkäisten toimintojen syntymisestä.

Toinen yleisen tason kommentti koskee linjausluonnoksen rakennetta. Osalinjaus tutkimusdatan avoimesta saatavuudesta on osa laajempaa kokonaisuutta nimeltään ”Tutkimusaineistojen ja -menetelmien avoimen saatavuuden linjaus”, joka tulee myöhemmin vielä täydentymään avoimien tutkimusmenetelmien osalinjauksella. Dokumentin sivulla 5 todetaan: ”Tämä tutkimusaineistojen ja -menetelmien avoimen saatavuuden linjaus koostuu koko linjaukselle yhteisistä strategisista periaatteista, sekä osalinjauksista, joissa määritellään tavoitteita ja toimenpiteitä kullekin osa-alueelle”. Kuitenkin nyt käsillä olevassa dokumentissa strategiset periaatteet kuvaavat ainoastaan tutkimusaineistoja. Onko tutkimusmenetelmiä koskevia strategisia periaatteita tulossa lisää? Kontekstin sekä linjausten ja osalinjausten suhde tulisi selittää lukijalle jo aivan dokumentin alussa.

Linjausluonnos sisältää hyviä ja erittäin ajankohtaisia tavoitteita. Aineistojen avaaminen on oleellista, jotta tutkimustieto pystyy paremmin palvelemaan sekä tiedettä että ihmiskuntaa kokonaisuudessaan. Mutta kun otetaan huomioon tutkimusorganisaatioiden kurjistunut rahoitustilanne, linjauksen aikataulutavoitteet tuntuvat osin liian kunnianhimoisilta. Linjausluonnos edellyttää tutkimusorganisaatioilta monenlaisia toimenpiteitä, mutta ei ota kantaa siihen, millaisilla resursseilla nämä toimenpiteet toteutetaan. Organisaatiokohtaiset tukipalvelut tarvitsevat pysyvän ja riittävän rahoituksen sekä olemassa oleviin että uusiin datanhallinnan tehtäviin.
14
Lapin yliopistoPeriaate on hyvin kiteytetty. Periaatetta ei kuitenkaan ole avattu lainkaan tässä. Tässä olisi oikea kohta avata sitä, mitä vastuullisella avaamisella tarkoitetaan.

Toimeenpanon seuranta kuuluu ennemmin tavoitetasolle kuin periaatetasolle.
Periaate on jälleen hyvin kiteytetty. Tätäkään periaatetta ei ole kuitenkaan avattu tässä lainkaan. Tässä olisi oikea kohta avata mm. sitä, mitä aineistonhallinnan infrastruktuureilla ja palveluilla tarkoitetaan.

Toimeenpanon seuranta kuuluu ennemmin tavoitetasolle kuin periaatetasolle.
Myös kolmas periaate on hyvin kiteytetty. Tätäkään periaatetta ei ole kuitenkaan avattu tässä lainkaan. Tässä olisi oikea kohta avata mm. hyvän aineistonhallinnan käsitettä ja niitä tapoja ja konteksteja millä ja missä tutkimusaineistoon liittyvää työtä ja aineistojen avaamista tulisi huomioida.

Toimeenpanon seuranta kuuluu ennemmin tavoitetasolle kuin periaatetasolle.
Tavoite on selkeästi asetettu ja antaa itsessään yksiselitteisesti ohjeet toimeenpanon seurannalle.

Seuranta ja vastuutahot tulisi eritellä tässä eikä periaatetasolla.
Tavoite on jälleen selkeä, kytkeytyy loogisesti periaatteisiin ja määrittää hyvin toimeenpanon seurantaa.

Seuranta ja vastuutahot tulisi eritellä tässä eikä periaatetasolla.
Tavoitteen muotoilussa tulee pohtia uudelleen asetettua aikarajausta ”viimeistään vuonna 2024 päättyvissä”; hankkeita koskevat rajoitukset ja ehdot määritellään aina rahoituspäätösvaiheessa eikä jälkikäteen voi asettaa uusia ehtoja käynnissä olevia hankkeita koskien. Kannustaisimme miettimään aikarajauksen mieluummin siten, että se olisi kytketty hankkeiden käynnistymisajankohtaan eikä niiden päättymispäivään. Muuten tavoite on selkeä ja asettaa hyvin ohjeelliset suuntaviivat seurannalle.

Seuranta ja vastuutahot tulisi eritellä tässä eikä periaatetasolla.
Viitaten edelliseen kohtaan: käynnissä olevalle tutkimukselle ei voi antaa jälkikäteen lisäehtoja ja rajoituksia. Sinänsä ilmaus ”mahdollistettu” lieventää tätä tavoitteenasettelun ehdottomuutta, mutta kannustamme pohtimaan uudelleen tavoitteenasettelua siten, että se muotoillaan kohdistuen ensisijaisesti uuteen, linjauksen käyttöönoton jälkeen alkavaan tutkimukseen.

Seuranta ja vastuutahot tulisi eritellä tässä eikä periaatetasolla.
Tämä tavoite on sinänsä ymmärrettävä ja siinä kuvattu ammatillinen kehitys tapahtunee luonnostaan linjauksen toimeenpanon yhteydessä tulevina vuosina. Ammatillinen kehitys ei kuitenkaan ole linjauksen ytimessä eikä tämä tavoite ole siten suoraan linjassa linjauksen periaatteiden kanssa vaan ennemminkin laajennus niihin. Ehdotamme tämän tavoitteen poistamista linjauksesta tai vähintäänkin uudelleen muotoilua suhteessa periaatteisiin.

Linjauksesta puuttuu erillinen kolmanteen periaatteeseen liittyvä tavoite, jota tässä olisimme odottaneet. Ehdotamme, että työryhmä pohtii vielä kolmannen periaatteen konkretisoimista tavoitetasolle. Periaatteen 3 yhteydessä esitetty toteutumisen varmistaminen ja seuranta antanee tähän jo hyvät lähtökohdat, jotka tulisi siirtää tavoitteet ja toimenpiteet osioon.
Linjauksen päämäärä on ilmaistu erinomaisen selkeästi. Kun linjauksen päämäärässä mainitaan ensimmäisen kerran FAIR-periaatteet, tulisi ne avata tai vähintäänkin antaa lukijalle tässä yhteydessä viitetiedot lisäinformaatioon tai sivulle, josta selitys löytyy. Nyt nämä periaatteet kuvataan vasta sivulla 7.

Johdannossa esitetty linjauksen rajaus on selkeä ja tutkimusaineistojen avaamisen motivointi, konteksti sekä siihen liittyvät haasteet on kiteytetty hyvin.

Johdannon kappaleessa ”Tutkimuksen vapaus ja tutkijan vastuu” käytetään myös rinnalla ilmausta ”tutkijan vapautta” (kappaleen rivi 3). Yhdenmukaisuuden vuoksi tämän voisi muuttaa kappaleen otsikoinnin mukaiseksi ”tutkimuksen vapautta”.

Johdannon kappaleessa ”Toimeenpano ja seuranta” todetaan lyhyesti, että ”Tutkimusaineistojen ja -menetelmien seurantamekanismit ovat vielä kehitysasteella”. Jotta toimeenpanolla ja seurannalla olisi uskottavuutta, tulisi seurantamekanismeista olla tässä vähintäänkin informaatiota siitä millä tasolla seurantaa tullaan toteuttamaan ja minkä tahon toimesta. Koska linjauksen elinkaareksi on tarkoitettu viisi vuotta ennen seuraavaa päivitystä, tulee tämänkaltaisia toteamuksia keskeneräisyydestä välttää. Koska toteutumisen varmistamisesta ja seurannasta on kuitenkin annettu jo suuntaviivoja periaatteiden yhteydessä, lausetta voinee päivittää.
Luonnos tutkimusdatan avoimen saatavuuden osalinjauksesta on varsin pitkälle valmisteltu ja lähes sellaisenaan kannatettava. Tässä esitetyt kommentit ovat lähinnä pienimuotoisia huomioita sinänsä kiitettävästi laadittuun kokonaisuuteen. Erityisesti kiitosta saa linjauksen rakenteen jakaminen strategisiin periaatteisiin ja konkreettisempiin tavoitteisiin, mikä on toimiva ratkaisu. Sen sijaan toteutumisen varmistamisen ja seurannan sijoittaminen periaatteiden yhteyteen ei niinkään ole loppuun asti mietitty ratkaisu. Kannustamme miettimään uudelleen, tulisiko kiteytettyjä periaatteita avata lyhyesti lisää ja siirtää toimeenpanon seuranta kokonaan tavoitetasolle ja tavoitteiden yhteyteen. Linjauksen jäsentelyssä on myös muuten vielä hieman parannettavaa. Mm. sivulla 10. on ikään kuin uusi pääotsikko osalinjaukselle. Nämä asiat tulisi esittää linjauksen alussa. Sivulla 10. ei tarvita kertausta osalinjauksesta tai sen rajauksista ennen ’Tavoitteet ja toimenpiteet’ -osiota.
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100