TÜ raamatukogu ja Eesti Rahvusraamatukogu koostöös valmis uus keeleressurss

05.01.2018

Tartu ülikooli raamatukogu ja Eesti Rahvusraamatukogu koostöös on valminud uus keeleressurss. Oleme teinud kättesaadavaks uuema eesti ilukirjanduse põhjal loodud sõnamitmikute sagedusloendid. Olemas on nii tekstisõnade kui ka nende algvormide loendid.

Alates 01.01.2017 jõustus autoriõiguse seaduse muudatus, mis lubab tekstikaeveks kasutada ka autoriõigusega kaitstud trükiste faile juhul, kui see kasutus ei taotle ärilisi eesmärke (AutÕS § 19 lg 31). Selline võimalus laiendab oluliselt uuema ja mitmekesisema uurimismaterjali kättesaadavust.

Esimese katsena lõime kõigile huvilistele vabalt kättesaadava keeleressursi. Eelkõige on see kasulik keeleteadlastele, keeletehnoloogidele ning masinõppe spetsialistidele lisatreeningandmeteks.

Kuna praegu oli võimalus kasutada ainult peamiselt 2017. aastal ilmunud eesti ilukirjanduse tekste, siis põhjalikumaks uurimistööks on materjali esialgu vähe, kuid edaspidi loodame seda tööd jätkata ning materjali hulka kasvatada.

Olemas on nii tekstisõnade kui ka algvormide loendid, mis on kättesaadavad Tartu ülikooli andmerepositooriumis DataDOI:  http://datadoi.ut.ee/handle/33/41

Jaga seda lehekülge