Ligipääs keeleressursside sisule
Teenus
Ühtne ligipääs keeleandmestike sisule ja keeletöötlusvahenditele:
- a) avatud, autentimata ligipääs sisule (kui ei ole piiratud ehk sisselogimist ei nõuta)
- b) autentimist ja/või autoriseerimist nõudvale sisule ja keeletöötluse töövoogudele - võimalik Eesti (TAAT) või CLARINi identiteedipakkujate föderatsiooni kaudu.
Tutvustame (eelkõige) teaduskasutajatele
- Katalooge, kust keeleandmestikke jm keeleressursse leida võib (CLARIN VLO, DataCite, Meta-Share keskregister)
- ühendatud sisuotsingu süsteeme (RABA ja CLARIN Federated Content Search)
- tekstitöötlusvahendeid (Keeleliin ja Language Resources Switchboard)
- keeleressursside kollektsioone (CLARINi ressursipered).
Õpetame teaduskasutajatele andmeotsingut ressurssidest: korpuste otsingusüsteemid, nende erinevused, otsingu laiendatud võimaluste (filtrid, metaandmed, loogikaoperaatorid, regulaaravaldised) kasutamine, eelkõige KORP otsingusüsteemi https://korp.keeleressursid.ee/ näitel.
Õpetame keeleteadlasi ja digihumanitaare, kuidas uurimisküsimus päringuks vormistada ja seejärel päring täiustada ja lisamürast vabastada.
Koostame ka spetsiifilisemaid koolitusi: eesti keeleressursid abiks eesti keele võõrkeelena õpetajatele, eesti keele emakeelena õpetajatele, ettevõtjatele (1. sihtrühm eesti ärikeele kasutajad, 2. sihtrühm keelega seotud ärirakenduste loojad), võru keele huvilistele, terminoloogidele, leksikograafidele.
Korpuste päringukeskkond KORP
Paindlik ja mitmekesine korpuspäringu keskkond, mõeldud nii lihtsamate päringute jaoks algajale kasutajale kui ka kogenud kasutajale, kes soovib ise regulaaravaldisi kirjutada. Päringutulemused esitatakse nii KWIC (KeywordInContext) kui sagedusstatistikutena, mitmekesised võimalused otsinguparameetreid vahetada ja kombineerida, kasutada loogilisi operaatoreid jne
Võimalik läbi rääkida oma korpuse lisamise osas.
Kontaktisik: Neeme Kahusk, See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.
Keeletöötlusmoodulite veebikeskkond Keeleliin
Keeletöötlusmoodulite toruteenus, mis võimaldab kasutajal keeletöötluse mooduleid (nt lausestaja, sõnestaja, lemmatiseerija, süntaksi moodulid) töövoogudesse järjestades töödelda (oma) keelelist andmestikku ja talletada vahepealseid sisendeid ja väljundeid. Kasutajate autentimine ja haldamine käib Entu kaudu.
Kontaktisik: Krista Liin, See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.
Keeleressursside ühendatud sisuotsing Raba
CLARINi ühendatud sisuotsingu (Federated Content Search, https://contentsearch.clarin.eu/ ) eeskujul loodud sisuotsingusüsteem, mis võimaldab agregaatorsüsteemil otsida määratud endpointide pakutavast sisust. Kasutaja jaoks on lihtsam ja keerukam otsingukiht, samuti võimalus endpointe ja pakutavaid andmestikke valida, sisse logida (et pääseda ligi piiratud kasutusõigusega andmestikele), päringuvastuseid alla laadida.
Kontaktisik: