ABCDEFGHIJKLMNOPQRSTUVWXYZ
1
AVOIMEN TIETEEN KANNUSTIMET: Aineistojen ja menetelmien avoimuus
2
Meritoituminen = Miten meritoi, miten mitataan, miten tietopohjaa pitää kehittää?
3
Palvelut = Avoimuutta ja meritoitumista mahdollistavat tuki- ja järjestelmäpalvelut
4
5
FAIR-periaateMeritoituminenPalvelut Muita huomioita. Miten mitataan? Tarvittavia palveluita? Tarvittavia toimenpiteitä?Kannustimet: olemassaolevat ja ehdotuksia
6
FPysyvä tunniste metadatalle Kansallinen: QVain
Kansainvälinen: esim. Zenodo
DOI, URL
Kansallinen suositus hyviksi käytännöiksi (koskien PIDejä) https://wiki.eduuni.fi/pages/viewpage.action?pageId=89602904


Julkaistu metadata julkaisutyypiksi OKM:n tiedonkeruuseen.
Huomiointi yliopistojen rahanjakomallissa.
Huomiointi yliopistojen sisäisessä rahanjaossa.
7
FPysyvä tunniste datalle (aineisto-/dataseteille)Kansallinen: Tietoarkisto
Kansainvälinen: esim. Zenodo
Julkaistu metadata julkaisutyypiksi OKM:n tiedonkeruuseen.
Huomiointi yliopistojen rahanjakomallissa.
Huomiointi yliopistojen sisäisessä rahanjaossa.
8
FKoneluettava metadata Kansallinen: QVain
Kansainvälinen: esim. Zenodo
On opittu jo lukemaan julkaisujen bibliografisia tietueita ja niissä olevia metadatoja.
Vähitellen myös datojen metadata opitaan ymmärtämään yhdeksi julkaisutyypiksi.
(Meta)datan indeksoitavuus ja haravoitavuus tietokantoihin.
Tutkijan ja tutkimuksen näkyvyys.
Rikas metadata paremman tieteen mahdollistajana (better metadata means better science)

9
RMuu dokumentaatioEdellytys aineistojen jatko-/uudelleenkäytölleMahdollistaa datan jatko-/uudelleenkäytön.
10
F, A, RSuuren yleisön, yritysten ja yhdistysten osallistaminen aineistojen ja metadatan koostamiseen ja käyttämiseen (erit. laadullinen tutkimus)Aila ym. palvelut
Kirjastot, arkistot (myös yksityiset), museot, yliopistojen yht. kun vuorovaikutuksen resurssit ja palvelut (onko näitä vai ovatko yksittäisten tutkijoiden ja tutkimusryhmien harteilla?)
Tutkijoiden tukeminen ja riittävät välineet ja resurssit osallistamistyöhön (työajallisesti ja välineellisesti).
Tutkimusaineistot ja yhteiskunta: rajapinta. Miten tavallinen ihminen osallistuu?
Etiikka? Lainsaadäntö?
Onko tietoa asiasta vielä juurikaan saatavissa???

Kansalaistieteen ja yritysyhteistyön edistäminen.
Aineistojen käytettävyyden ja saavuttettavuuden edistäminen.
Kansalaistiede itsessään jo tutkimusta, joka hyödyttää myös tutkijaa.
Kansalaistieteeseen resurssointi: tutkijalle aikaa ja rahaa.
Kansalaistieteen edistämisestä palkitseminen esim. tutkimusvapaalla.
Akatemiahankkeissa on jo nyt olemassa kohta, jossa pitää kuvailla "Effects and impact beyond academia". Tässä voitaisiin kansalaisten osallistamiseen kannustaa yhä enemmän.
11
FLöydettävyys tietokannoista ja arkistoistaKansallinen: Etsin
Kansainväliset palvelut esim re3data.org -palvelusta
Tietokannoista löydettävien (meta)datasettien lkm.
Vrt Dora-julistus ja vastuullisuus metriikassa!
Tietokannoista löydettävien (meta)datasettien lkm per tutkija/per organisaatio/per maa/per infrastruktuuri jne.
Haravoitavuus Tutkimustietovarantoon.
12
IHaravoitavuus muihin tietokantoihin, arkistoihin ja luetteloihinKansallinen: Etsin ja TutkimustietovarantoTutkimuksen näkyvyyden lisääntyminen
13
FTutkimusaineistojen/datojen viitteidenhallinta julkaisuissa
Löytävätkö tutkijat helposti ohjeita dataan viittamisesta?
(Meta)datoihin viittaamisen kulttuuri vasta kehittymässä.
Out of cite, out of mind
14
F / ATekstinsisäiset viittaukset tutkimusaineistoon
Tutkimusaineistoviite bibliografiassa
RefWorks?
Mendeley
RefWorks ei ilmeisesti tue kovin hyvin tutkimusaineistoja julkaisutyyppinä.
Scopuksen dataan perustuvassa SciValissa mahdollisuus analysoida Scopuksen julkaisuissa mainittuja tutkimusaineistoja.
Pitäisikö asianmukaiset viittaukset olla pakollisia osio tieteellisissä julkaisuissa <= kustantajat.

Kuuluu vastuulliseen ja korkeatasoiseen tutkimukseen oleellisesti.
15
F(Meta)datassa viittaukset toiseen (meta)dataan?Meriitti sille, kenelle se kuuluu.
16
Julkaisussa perustelut sille, miksi data avataan tai miksi sitä ei voi avata -Examples of statements how to argue data sharing/not sharing data in a publication. Manchester University LibraryTutkija joutuu viimeistään tässä vaiheessa miettimään datan avoimuutta ja/tai sen astetta.
Lukijalle muodostuu kattava kuva datan luonteesta.
17
RJulkaisussa viittaukset ohjelmistoihinKuuluisiko hyvään metadataan?Aineistosettien uudeellenkäyttö helpottuu, kun tarvittavat ohjelmistot tiedossa
18
Tutkimusaineiston saaminen viittausten (siteerausten) lukumääräClarivate Data Citation IndexOn metriikkaa. Mitä kaikkea viittaus tutkimusaineistoon kertoo.
Vrt Dora ja vastuullinen metriikka
Kansallisarkiston arvonmääritys https://www.lausuntopalvelu.fi/FI/Proposal/Participation?proposalId=fa4694e7-d5c6-478d-80e8-6b55e879f8a5
Tutkimusaineiston saamien viittausten lukumäärä.
Viittaus voi olla osoitus siitä, että tutkimusaineisto on merkittävä ja voi siten laajentaa myös tutkijaverkostoa.
Kehitetäänkö tulevaisuudessa mahdollisesti jotain indikaattoreita tutkimusaineistoviittausten perusteella (vrt. esim viittaukset artikkeleihin - IF)?
19
AAvoimuus: metadataKansalliset FAIR-datapalvelut.
Tieteenalakohtaiset arkistot.
Kotimaiset arkistot.
Kansainväliset arkistot. Yliopistokohtaisesti raportointivelvoite esim. Converikseen
Voisiko olla valmiina esim. SA:n hakupohjassa esim. avoimeen tieteeseen liittyvät meriitit.
TENKin CV-pohjassa on jo.

https://www.aka.fi/ansioluettelo_en


Julkaistu metadata julkaisutyypiksi OKM:n tiedonkeruuseen.
Huomiointi yliopistojen rahanjakomallissa.
Huomiointi yliopistojen sisäisessä rahanjaossa.
Teot avoimuuden hyväksi datojen osalta osaksi tutkijan/tutkimuksen arviointia.
Rikas metadata tuottaa parempaa tutkimusta/tiedettä.
20
AAvoimuus: aineistosetit
Kansalliset: IDA, Tietoarkisto, Kielipankki
Kansainväliset:
Mahdollinen embargo perusteluineen
Jos aineisto ei ole avoin, onko perustelu metadatassa ja kerrottu julkaisussa
Julkaistu metadata julkaisutyypiksi OKM:n tiedonkeruuseen.
Huomiointi yliopistojen rahanjakomallissa.
Huomiointi yliopistojen sisäisessä rahanjaossa.
Teot avoimuuden hyväksi datojen osalta osaksi tutkijan/tutkimuksen arviointia
21
ATiedostomuotojen avoimuus ja maksuttomuusCSC

File formats v1..6.1Tiedostomuotojen avoimuus helpottaa aineistojen uudelleenkäyttöä.
22
AMetadatan saatavuus vaikka varsinaisia datasettejä ei enää olisikaanMahdolliset viittaukset (meta)dataan kirjallisuudessa säilyttävät "merkityksensä" eivätkä jää haamuviittauksiksi.
Tutkimuksen luotettavuus ja toistettavuus.
23
A / IPitkäaikaistallennushttp://www.digitalpreservation.fi/enLupa-ym. prosessit organisaatioissa
Tieteelliset seurat voisivat ottaa koppia palkintoideasta?
Kansallisesti tuotettujen merkittävien aineistojen lukumäärä per tutkimusorganisaatio.
Avoimen tieteen palkinto kansallisesti merkittävälle tutkijalle/tutkimusryhmällä/organisaatiolle tutkimusaineistojen näkökulmasta.
Palkinnot tieteenalakohtaisesti.
Palkinnot organisaatiokohtaisesti.
Siis tunnustukset eri tasoilla ja eri tahoilta.
24
IKoneluettavuusMetadatastandardit kuten Dublin CoreVoivat olla valtaosalle vieraita. Tuttuja esim. kirjastojen luettelointi-ihmisilleHaravoitavuus erilaisten palvelujen ja tietokantojen välillä mahdollistuu.
25
IStandardien käyttö metadatassaAlakohtaiset standardit
Yleiset standardit esim. käytettyjen kielten ilmaisuun
Joillakin tieteenaloilla standardien käyttö hyvinkin tuttua ja joillakin täysin päinvastoin.
Koulutukset yleisistä ja tieteenalakohtaisista standardeista tarpeen sekä tukihlöstölle että tutkijoiolle


Voisiko tuki (opetus, neuvonta) kannustaa käyttöön?
(Meta)datojen kuvailusta samalla tavalla universaalisti ymmärrettävää kuin kirjallisuuden kuvailusta.

26
ISanastojen, ontologioiden ja tesaurusten käyttö metadatassaYleinen suomalainen ontologia, YSO
Tieteenalakohtaiset sanastot ja tesaurukset
Palveluja on tarjolla runsaasti, mikä voi hämmentääJärjestelmän toimiminen taustalla ilman lisävaivaa ja datan syntyminen melkein automaattisesti motivoi tutkijaa.
Ontologiat ja tesaurukset mahdollistavat datojen laajan analyysin, koska termeillä on hierarkinen rakenne ja siten suppeampia/laajempia merkityksiä, asiayhteyksiä ja linkkejä toisiinsa.
27
RTutkimusmenetelmäAvoimet lisenssit
Avoimet repositoriot
Menetelmien avoimuus = lähdekoodin avoimuus.
Jääneet vähemmälle huomiolle.
Lähdekoodit ym. menetelmät kiinteä osa tutkimusaineistoja.
Millaisia julkaisufoorumeita on tutkimusmetodeille?
Integrointi tutkimustietovarantoon?
Menetelmillä datasta tulkitaan tietoa, niiden olemus jnkv hankala, asian tärkeyden hahmottaminen vaikeaa.
Data ja menetelmät kuuluvat yhteen.
Valmisteltavissa EU-linjauksissa mainitaan menetelmät osana tutkimusdataa.

Uuden menetelmän kehittämisestä julkaisu, joka tutkijan julkaisuluetteloon ja avoimesti saataville verkkoon. Ei välttämättä tieteellinen vertaisarvioitu. Meriitti menetelmän kehittäjälle viittausten kautta.
On jo jotain:
Menetelmätutkimukset lehdissä.
SA:n julkaisuluettelomallissa kohta softalle ja/tai datalle.
Voisiko nykyisistä käytännöistä meritoitua enemmän? Voisivatko olla enemmän käytössä?
Ehdotus: rahoittajat ja tutkimuslaitokset voisivat palkita enemmän tutkijaa.
28
ITutkimusaineiston keruussa käytetyt laitteet ja ohjelmistotTutkimusinfrastruktuuri (hardware, software)ks. onko toistoa ainakin softan osalta
Tutkijat eri asemassa infrojen suhteen riippuen työsuhteesta yo:oon.
Linkitysten avulla voi yhdistää julkaisut, (meta)datan, infrastruktuurit, tutkijat jne.
Tutkijan ja tutkimuksen näkyvyys.
Selvemmin osaksi hankerahoitusten budjetointia, jolloin edistäisi tutkijoiden tasa-arvoa.
29
RLisensointihttps://creativecommons.org/Myös avoimet datat tulee lisenssoidaLisensointi varmistaa metadatan/aineistosettien oikean käytön ja esim. velvoittaa viittaamaan, jolloin meriitin saa se, kenelle se kuuluu.
30
RKäyttöoikeudet, -lupaMahdollisesti lupaprosessiTutkijalle (aineiston omistajalle) parempi kontrolli oman aineistonsa suhteen.
Suojaa datan tutkimuskohteelle.
31
ROmistajuusKuka omistaa? Tutkija ja/tai organisaatio?Oikeudenmukaisuuden periaate toteutuu, kun sovitaan heti aineistonkeruun alussaSelvä sopimus kannustaa molempia osapuolia.
32
Tutkimuksen koko työvirta avattu - ei pelkkä data tai yksittäiset menetelmät
Avoimet lisenssitTutkimuksen toistettavuus ~periaatteellinen toistettavuus.
Usein tarvitaan useita menetelmiä, jolloin osa voi olla avoimia, osa ei . Vaikeuttaa toistettavuutta ja eri palasten yhdistelyä.
Avoin lähdekoodi/data/tutkimuksen tekniset yksityiskohdat täydellisesti esitettyinä mahdollistaa työvirran täyden replikoinnin (kopiointi riittää, ei tarvitse uudestaan kirjoittaa..)
Toistettavuus ja replikoitavuus eri asioita!
Uudelleenkäytettävyys sisältää myös muokattavuuden ja ehkä käytön uusiin tarkoituksiin.
Huomion kiinnittäminen asiaan.
Replikoitavuustagi on jo olemassa joillakin lehdillä. Vaikea valvoa. Laajempi käyttö haasteellista.
Lähdekoodin avoimuus sinänsä jo askel replikoitavuuteen.
33
RMetadatan lisäksi rikas kuvailu, dokumentaatioOrganisaatioissa dokumentaatioon liittyvät palvelut voisivat olla selvemmin esillä.Mahdollistaa tutkimusaineiston käytön myöhemmin. On sen edellytys.Osoitus laadukkaasta tutkimustyöstä.
Helpottaa avaamista, joka meritoi.
Monissa repositorioissa avaamisen edellytys.
34
RAineistojen avaaminen muille tutkijoille
Tieteelliset lehdet
- data-artikkelit
- tieto datasta julkaisuissa ml. viittaukset
Data-arkistot, -repositoriot ja - kataloogit
Data-agentit. Data scientists. Datatuki
Alakohtaista. Meritoitumisen suhde tutkimusalalla vallitseviin normeihin? Mahdolliset rajoitteet ja embargo huomioiden. Valvonta?Lisää monitieteistä tutkimusta.
Tuo tutkimukselle uusia ulottuvuuksia - vielä sellaisia, joita ei osata arvataan.
35
Yliopistojen tuottamat tutkimusaineistot yritysten käytettävissäOhje yritysyhteistyötä ja siinä huomioitavista asioista kuten esim. oikeudelliset asiat, IPR, sopimusjuridiikka, kaupallistaminen jne jne.?Lisääntyvä yritysyhteistyö.
Vaikutus yritysten innovaatio ja T&K- toimintaan.
Vaikutukset korkeakoulutettujen työllistymiseen yrityksissä.
36
RPerusopiskelijat tutkimusaineistojen käyttäjinä. Käyttö esimerkiksi opinnäytteissä ja projektitöissä.
Olemassaolevien tutkimusaineistojen käyttö voi nopeuttaa opintojen valmistumista
Opintojen ja valmistumisen nopeutuminen.
Tutkijan keräämä aineisto tulee viitatuksi myös opinnäytetöissä.
37
RTutkimusaineistot opetuksessaSamat palvelut kuin tutkijoilleTulevien tutkijoiden perehdytystä.
Mitä opettaja itse voisi hyötyä tästä??
On olemassa helposti saatavissa olevia aineistoja opetuksen käyttöön.
Opettajan CV:hen teko avoimuuden puolesta.
Opettajatutkija saa viittaukset, jotka hänelle kuuluvat.
38
RDatasettien uudelleenkäyttö
39
Datametriikka/Datoihin liittyvä altmetriikkaMendeley
Twitter
LinkedIn
Academia.edu
ResearchGate
Google Scholar
Datametriikka osa altmetriikka? Vai bibliometriikkaa?
äsitteiden määrittely, vakiintuneet käytännöt ja palvelut vielä hyvin alkuvaiheessa.
Downloads. Citations. Views. Ym.
SciValissa mahdollisuus analysoida niitä Scopus-julkaisuja, joiden metadata/data on viety Mendeleyhin.
Vrt vastuullinen metriikka.



Datametriikan hyödyntäminen ryhmien, organisaatioiden ja muiden isompien entiteettien arvioinnissa muuta arviointia tukemaan.
Tutkijan ja tutkimuksen näkyvyys
40
Data management plan - aineistonhallintasuunnitelmaDMPTuuliSeuranta organisaatioissa? Esim. Manchesterin yo:ssa tehtävä kaikille tutkimusprojekteille. Kaikista DMP:stä annetaan myös kommentit/arvio.Tutkimusprojektien hyvä hallinta.
DMP yhdeksi julkaisutyypiksi (CRIS:in tms kautta) OKM:n tiedonkeruuseen.
Voisiko joskus olla jopa tutkimusprojektin aloittamisen ehto organisaatiossa??
DMP:stä automaattisesti tieto muihin järjestelmiin (esim. tietosuojailmoitus, IT-tuen tarve jne.) sekä automaattisesti DMP:n kommentointi esim. rahoitushakemusta varten.
DMP:n avoimuus levittää tietoa myös tutkimuksesta.

41
Dynaamiset DMP:tIntegrointi yo:jen CRIS-järjestelmiinDMP:t heti prosessiin: kommentointi, IT-tukipyynnöt, tietosuojailmoitukset => helpottaa ja nopeuttaa tutkijan työtä. Ja suoraan CRISiin tms. järjestelmään.
Ks. solu yllä
42
Tutkimusaineistojen vertaisarviointiesim. https://www.earth-system-science-data.net/Löytyykö jostakin avoimia aineistojen vertaisarviointeja?
Tutkimuksen laatu.
Meriitti vertaisarvioinnin suorittaneelle tutkijalle avoimesta vertaisarvioinnista.
43
Julkaisussa kaikkien osallisten roolit esitettyinäTENK:n suositus tekijyydestäAineiston keruuseen osallistujille heille kuuluva meriitti roolit eriteltyinä.
44
Metatutkimukset datastaEvidenssi dataan liittyvästä metriikasta.
Tutkijoille tarjolla uudehko tutkimusala.
Tutkimusvapaa kiinnostuneille.
45
(Meta)dataan liittyvät asiantuntijatehtävätRahoituksen kysyntä lisää rahoituksen tarjontaa?Osaksi tutkijan & tutkimuksen laadullista arviointia. https://avointiede.fi/fi/verkostot/eosc-co-creation
46
TutkimusrahoittajatMetadatan ja/tai datasettien avaaminen julkisen rahoituksen ehto.
Voisiko siitä saada myös lisäpisteitä hakuvaiheessa?
47
KustantajatErilaiset badget (meta)datan avoimuudesta esim. kustantajilta, joita tutkija voisi viedä omille kotisivuilleen.
48
AVoimien tutkimusaineistojen käyttäminen tutkimuksessaSäästää resursseja, jos avoimia aineistoja käytetään uudelleenOn teko avoimuuden edistämiseksi.
Tutkimustyön nopeutuminen.
49
Tutkija FAIR-data koulutukseen tai muuhun tutkimusaineistojen hallinta -koulutukseen osallistujanaMerkintä CV:ssä
50
Organisaation hyvä tutkimusaineistojen hallinta yleensäHelpottaa organisaatiossa suunnittelua ja tutkimusstrategian kehittämistä.
Hyödyttää myös tutkijaa lopulta.
51
Data-artikkelien merkitys julkaisukentässäSuomessa Data-asiain kansalliskomitea ylläpitää listaa datalehdistä https://www.fcrd.fi/data-journal-directory/Osa ns. normaalia tieteellistä kommunikointia, johon kuuluu vertaisarviointi, ja viittauskäytännöt.

OA-maksut koskettavat myös datalehtiä






"Unlike conventional journals with data-sharing mandates, data journals reward authors who share their data. Unlike data archives, data journals bring access and documentation into the mainstream of scholarly communication through conventional practices such as authorship, publication and citation." Calters (2020).
Data-artikkelista tutkijalle vertaisarvioitu julkaisu julkaisulistaan.
Data-artikkelit muiden julkaisujen mukana myös yliopistojen RAE-arvioinneissa.
Jatkossa myös avatut (meta)datat mukaan RAE-arviointeihin?
Authorship creditin tulisi olla yhtä arvokas kuin "data creditin".
Useita datalehtiä indeksoidaan esim PubMediin ja Scopukseen. Tutkijan ja tutkimuksen näkyvyys.

52
Nanopublicationshttp://nanopub.org/wordpress/
Yksi tapa jakaa tietoa tutkimusdatasta
Tutkijan ja tutkimuksen näkyvyys.
Saadut viittaukset.
Tutkimustulosten tehokkaampi, nopeampi ja käyttäjääystävällisempi jakaminen.
53
Laki/säädöshttps://www.lausuntopalvelu.fi/FI/Proposal/Participation?proposalId=209d1bca-2280-4e87-ab0f-ef045ff40cd4&respondentId=805cb813-2da4-45ca-9c2d-0d8bc99b4ce9&proposalLanguage=9ff64fe9-04da-4471-9f0c-3f2016e71b4fLaki velvoittaisi avaamaan (meta)datan ja/tai perustelemaan avaamattomuuden/tai sen eri tasoja.
54
Organisaation olemassaolo ja mukana pysyminen avoimen tieteen kehityksessäOrganisaation asema vakavasti otettavana tutkimusinstituutiona.
Organisaatio tutkijan työpaikkana.
Organisaatio merkitys paikkakunnan työllisyydelle.
55
FAIR - Fully AI Readyvirus outbreak data netword VODANFully AI Ready
vrt esim. COVID 19
Tutkimusaineistot globaalin tiedeyhteisön käytettävissä ja analysoitavissa.
Ajan ja resurssien säästö.
Mahdollistaa uuden informaation tuottamisen datan perusteella-
Vauhdittaa uusia tieteellisiä lähestymistapoja ja tutkimuksia datan perusteella.
Tutkimusaineistojen hyödyntäminen tutkimuksessa ihmiskunnan hyväksi.
Meriitti tutkijalle.
56
Avoin tiedeFAIR data mukana aina avoimessa tieteessä
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100