ERFi projekt 3.2.0304.12-0396 “Eesti Keeleressursside Keskus”

alameetmes "Riikliku tähtsusega teaduse infrastruktuuri kaasajastamine" investeeringute kava

Projekti lühikirjeldus:

EKRK tegevuse eesmärgiks on muuta olemasolevad keeleressursid ja keeletöötluse vahendid kättesaadavaiks, vastastikku toimivaiks ning stabiilseteks oskusteabega varustatud teenusteks, mida kasutajad saavad vajaduse korral ka oma tarbeks kohandada. Kõik keeleressursid ja nende töötlemise vahendid, mis Keskusesse koondatakse, peavad vastama rahvusvahelistele standarditele ja olema varustatud ressursi pakkujate poolt kasutuslitsentsiga eri tüüpi kasutajate (üldine avalik, akadeemiline, kommerts) jaoks.

Eesmärk:

EKRK loomise eesmärgiks on tõsta Eesti teadus- ja arendustegevuse konkurentsivõimet arvutilingvistika ja keeletehnoloogia vallas uue ja kaasaegse teadustaristu loomise kaudu. Keskusse koondatud digitaalsete ressursside (sõnastikud, teksti- ja kõnekorpused, keeleandmebaasid) ja keele töötlemise vahendite kasutajateks on partnerasutused jt Eesti teaduse, arenduse ja innovatsiooniga tegelevad asutused ning partnerid üleeuroopalises CLARINi konsortsiumis.

Projekti tulemus:

EKRK tehnilise taristu moodustavad partnerasutuste poolt hallatavad arvutus- ja salvestusressursid ning keskteenused.  
* Hangiti ja seadistati keskseid teenuseid pakkuvad serverid Tartu Ülikooli juures.

* EKRK keskserverid pakuvad majutusteenust.

* Töötati välja kesksed lahendused SSO ja kasutajate autentimise ja autoriseerimise (AAI) teenustele.

* Hangiti Keskusele püsiidentifikaatori (PID) tunnused nii Handle kui DOI (Digital Object Identifier) süsteemis ja töötati välja PIDide omistamise töövoog. DataCite Eesti (http://datacite.ut.ee/services.php ) kaudu saavad kõik EKRK keeleressursside registris registreeritud ressursid DOI-identifikaatori andmekeskuses ESTDOI.KEEL.

* Kohandati EKRK meta­andmete register (https://metashare.ut.ee/ ) töötama EKRK ja CLARINi nõuete ja vajaduste kohaselt.

* EKRK kaudu on keeletehnoloogiahuvilistel võimalik kasutada veebiteenuseid:
EKRK keeleressursside register META-SHARE: https://metashare.ut.ee/
EKRK keeleressursside repositoorium ENTU: https://entu.keeleressursid.ee
Korpuste päringuteenus KORP: https://korp.keeleressursid.ee/
Keeletöötlusmoodulite veebikeskkond Keeleliin: http://keeleliin.keeleressursid.ee/
Teksti annoteerimisvahend BRAT: https://korpused.keeleressursid.ee/brat/
Koodihoidla GitLab: https://gitlab.keeleressursid.ee/explore/projects

* Lõimuti edukalt 2012. aastal tegevust alustanud CLARIN ERICu (http://www.clarin.eu/)  riikliku konsortsiumina Euroopa teadustaristuga ja järgiti oma tegevustes CLARINi tegevuskava ning juhiseid. CLARINi keeleressursside registris Virtual Language Observatory (VLO) on ühtses CMDI formaadis kajastatud kõik EKRK registrist korjatud keeleressursside meta-andmestik


Toetuse summa: 1 229 985 eurot (2012-2015)