Tartu ülikooli loodusteadlased registreerisid ligi pool miljonit teadusandmete objekti

11.06.2015

PlutoF pilves talletatavatele teadusandmetele omistati paari päeva jooksul 486 912 DOI-numbrit (Digital Object Identifier). Püsivate identifikaatorite registreerimine toimub DataCite Eesti konsortsiumi kaudu, mille abil tagatakse liitunud teadusasutuste liikmeskonna poolt loodud kvaliteetsete teadusressursside laialdane leitavus ja kasutatavus.

TÜ loodusmuuseumi direktori Urmas Kõljala sõnul võimaldab DOI süsteem teadlasel teha enda andmed lihtsamini kättesaadavaks ning tsiteeritavaks. Ligi pool miljoni DOI-ga registreeritud andmestik on pärit seentegeenijärjestustel põhinevast globaalsest infosüsteemist, mis võimaldab liikide automatiseeritud identifitseerimist mistahes proovist (sh muld, vesi, taimehaigused, meditsiini proovid jne).

Iga liik on süsteemis esindatud iseseisva andmebaasiga ja varustatud nüüdseks unikaalse DOI-numbriga, mille abil saab liike kommunikeerida eri valdkondades nagu põllumajandus, meditsiin, loodusteadused jm. Liikide andmebaase arendab Tartu ülikooli teadlaste juhtimisel UNITE rahvusvaheline konsortsium ning neid talletatakse PlutoF pilves, mida arendab Eesti teadustaristu teekaart NATARC.

PlutoF platvormi teadusandmete avaldamise mooduli arendamisega alustati 2014. aastal DataCite Eesti projekti raames. Esmalt valmis PlutoF veebi-töölaual andmebaasitugi ja graafiline kasutajaliides teadusandmetele DOI taotlemiseks. 2015. aasta alguses tehti ettevalmistustöid ligi 500 000 UNITE liigihüpoteesi avaldamiseks, mille tarbeks loodi automatiseeritud lahendused andmesettide koostamiseks, metaandmete lisamiseks ning DataCite süsteemis registreerimiseks. Andmestiku paremaks visualiseerimiseks loodi ka spetsiaalne SH DOI vaade (nt http://dx.doi.org/10.15156/BIO/SH005435.07FU).

Elurikkuse informaatika ja digiarhiivide töörühma peaspetsialisti Allan Zirki sõnul võttis kompleksse lahenduse väljatöötamine aega mitmeid kuid, millest viimase etapi lõpuleviimiseks kulus nädal. „Andmete registreerimisel esines ka väikeseid tõrkeid, mis nõudsid serverite konfiguratsiooni muutmist ning suuremahulise andmestiku registreerimiseks tehtavate API päringute optimiseerimist arvestamaks DataCite'i serverite ressurssidega, kuid üldiselt kujunes kogu protsess edukalt,“ tõdes Zirk.

Kuivõrd aktiivselt andmeid edaspidi indekseeritakse sõltub Allan Zirki sõnul PlutoF pilves ökoloogia, geneetika ja taksonoomia andmebaase talletavate kasutajate aktiivsusest. Uurijatel on võimalik tõsta enda andmed mistahes formaadis PlutoF pilve ja küsida DOI indentifikaatorit. Samas süsteemis olevale andmebaasile või selle väljavalitud osale saab DOI-sid automaatselt registreerida, see aga hoiab kokku uurijate aega, sest andmed liiguvad andmebaasist otse DOI süsteemi.

„Kuna teaduse avaandmete tsiteerimine ning selle rahvusvaheline arvestus kogub kiiresti hoogu, siis on DataCite süsteemi kasutamine muutunud väga oluliseks. Uurimisprojektide rahastajad vaatavad seetõttu aina hoolikamalt kuidas uurimistöö käigus loodud andmestik avalikustatakse,“ selgitas Kõljalg. Monograafia, kus DOI-dega varustatud teadusandmeid avaldatakse, ilmub lähiajal koostöös online kirjastusega Pensoft.

TÜ raamatukogu ja TÜ loodusmuuseumi algatusel ning Eesti teadusagentuuri finantseerimisel liitus Tartu ülikool 2014. aastal rahvusvahelise organisatsiooniga DataCite, saades sellega õiguse omistada teadusandmetele üle Eesti unikaalseid DOI identifikaatoreid. Data Cite Eesti konsortsiumi moodustavad tänaseks Tartu ülikool, Tallinna ülikool, Tallinna tehnikaülikool ja Eesti maaülikool ning liituma on oodatud ka teised teadusasutused. Täpsem informatsioon Data Cite Eesti kodulehel.

Lisainfo: Urmas Kõljalg, TÜ loodusmuuseumi direktor, tel 737 6235, urmas.koljalg@ut.ee.

Jaga seda lehekülge