CLARINi veebikohvik kirjandusteadlastele

8. juulil toimus 3. CLARINi veebikohvik teadlastele: Kirjandusteadus. Seda modereeris CLARINi saadik Maciej Maryl (Poola Teaduste Akadeemia kirjandusliku uurimuse instituut).

Kohtumise eesmärgiks oli tutvustada digimeetodeid kirjandusteadlastele CLARINi tööriistade  varal. Sihtrühmaks olid uurijad, kes soovivad rakendada uusi meetodeid enda uurimisvaldkonnas ja tahaksid teada, kust alustada. CLARINi saadikud kaaluvad samasuguste ürituste korraldamist teiste sotsiaalia ja humanitaaria uurimisvaldkondade jaoks (nt ajalugu ja tõlketeadus).

Maciej Maryl alustas sissejuhatusega digihumanitaariasse ja selgitusega, kuidas CLARIN ja muud sarnased teadustaristud saavad uurijaid nende töös toetada. Kirjandusteaduslik CLARINi kohvik keskendus näidetele ja kasutusjuhtudele, mis edukalt lõimisid kirjandusteaduslikku uurimist digimeetoditega. Ettekanded avasid digitaalse kirjandusteaduse kolme aspekti: 1) korpuse loomine; 2) teksti märgendamine ja digitaalse väljaande ettevalmistamine ning 3) tekstianalüüs.

Esimese ettekande autorid Olga Gerassimenko (Tartu Ülikool, Eesti Keeleressursside Keskus) ja Marin Laak (Eesti Kirjandusmuuseum) rääkisid sellest, kuidas nad tegid oma ala ekspertidena koostööd Johannes Vares-Barbaruse ja Johannes Semperi käsikirjalisest kirjavahetusest digitaalse korpuse loomisel päringusüsteemi KORP abiga ning kuidas korpust on kasutatud kirjandusteadlasi huvitavate probleemide uurimisel. Marin on kirjandusteadlane ja Olga keeleteadlane ning arvutilingvist, ning koostöö Olgaga on aidanud Marinil lahendada uurimisküsimus, mis keskendus 1911-1940 aastate kirjavahetuses autorite Eesti-Euroopa identiteedile - ühist ettekannet saab vaadata videost.

Teises ettekandes jagas Beatrice Nava (Bologna Ülikool) oma kogemust traditsioonilise kirjandusuurijana, kes on alustanud digimeetodite rakendamist. Kaasaegse ja klassikalise filoloogi taustaga Beatrice kasutas uurimisküsimuste lahendamiseks DEA projekti: Archilochuse digiväljaannet, mis sai teoks tänu CLARIN-IT toetusele. DEA projekti eesmärgiks oli koostada kogu Archilochuse korpuse teaduslik digiväljaanne, mis oleks kasutatav nii uurijatele kui ka mitteakadeemilistele kasutajatele. Beatrice kirjeldas projekti valmimisfaase, mainides ka esimesi tulemusi ja lahendamist vajanud probleeme. Dea märgendatud korpus on hoiul CLARINi Itaalia konsortsiumi repositooriumis ILC4CLARIN . Beatrice rõhutas CLARINi kui olulist teejuhti uurijatele, kes pole veel tuttavad digitaalmeetoditega ja vajaksid selles keskkonnas esmast nõustamist. Ta tõi välja ka CLARIN mobiilsusgrante kui hindamatut võimalust uurijatele, kes tahaksid ekspertsust teatud alal omandada või teistega jagada.

Kolmandas ettekandes rääkis Joanna Byszuk (Poola Teaduste Akadeemia poola keele insituut) tekstianalüüsi ja stilomeetria kasutuse kogemusest WebStyML, mitmekeelse veebipõhise tööriistaga, mille on loonud CLARIN-PL koostöös Maciej Ederiga. Pärast lühikest sissejuhatust kauglugemise ja stilomeetria mehaanikasse kirjeldas Joanna stilomeetria kasutust praktikas, näiteks autorluse määramisel või korpusepõhisel idiolektide uurimisel, stilokronoloogias, žanriüleste või žanrisiseste suhete uurimisel.

65 osalejaga CLARINi kohvik jätkus pärast ettekandeid aktiivse diskussiooniga kuulajate ja esitlejate vahel, mis näitas selliste ürituste vajalikkust teadmiste vahetamisel. Laiale kasutajaskonnale mõeldud üritus suutis kokku tuua kirjandusteadlasi väga erinevate uurimisfookustega ja ühise huviga kasutada digimeetodeid kaasaegses humanitaarias, mis on oluline samm digihumanitaaria ja valdkonnasisese uurimistöö vahelise lünga täitmisel.

Kui te olete huvitatud koostööst humanitaarvaldkonna uurijate ja digiekspertide vahel, kaaluge registreerimist veebitöötoale Twin Talks III DH2020 konverentsil. Et saada regulaarset teavet CLARINi tegevustest, on võimalik tellida uudiskirja. Ülevaadet CLARINi pakutavatest rahastamisvõimalustest või saada rahastusleheküljelt. Soovitame tutvuda ka täienevate CLARINi ressurssiperedega

Veebiseminar "Hüpoteesid päringuteks: otsingud kirjanduslikest korpustest"

Esimene seminar sarjast "Best Practices on Digital Humanities",  mida korraldasid Eesti Keeleressursside Keskus ja Eesti-uuringute Tippkeskuse Kirjakultuuri ja kirjandusuuringute töörühm

EKRK spetsialistid kutsusid huvilisi arutama kirjanduslike tekstikorpuste loomise ja märgendamise teemal. 

  • Kuidas muuta oma uurimishüpoteesid korpusepäringuteks? 
  • Milliste kategooriate märgendamist oleks tarvis kriitikatekstide korpuses?

Korpusepäringute võimalusi demonstreeriti ajaloolise Semperi ja Barbaruse kirjavahetuse tekstikorpuse näitel päringusüsteemis KORP.

Veebiseminar toimus 26.05.20 kell 14.00-15.45 MS Teamsi keskkonnas, seminari viis läbi keeleressursside spetsialist Olga Gerassimenko.

Video -  KORPis leiduvad korpused ja näidisotsingud - 13 min

  • Mis ajaleht 1990-2000 on kõige luuletuselembesem
  • Kus kõige rohkem sõna “luuletus” ja selle derivaate kasutatakse - kas EPL, Postimees, SL Õhtuleht või Eesti Ekspress? 
  • statistika 2000-2001: mõisted nagu suhtarv ja absoluutarv, tegelikult EE-s kaks korda rohkem 

Video - Laiendatud otsingu näited ja vastused kuulajate küsimustele - 20 min

Avaseminari ühiskommentaarium https://tinyurl.com/avaseminar

Küsimused ja ettepanekud on teretulnud! See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.

EKRK teenuste tutvustus ERÜ kevadkonverentsil 2019

Eesti Rakenduslingvistika Ühingu kevadkonverentsil 25. aprillil 2019 Tallinnas tutvustas EKRK kuulajatele enda ja CLARINi veebiteenuseid. 

EKRK teenustest tuntakse humanitaaride hulgas enim KORPi - korpuste päringusüsteemi, mis loodud Rootsi Keelepangas (Språkbanken) ja mis võimaldab keelekasutust uurida eri tasemel märgendatud korpustest ning saada vastuseks lisaks tavapärasele konkordantsile ka statistilised näitajad ja kollokatsioonid. Päring on väga paindlik ja hõlpsalt muudetav. Eesti KORPis on praegu erinevaid korpusi kokku enam kui 850 miljonit sõnet (tekstisõna). Hoopis rohkem sõnesid ja võimalusi on aga Kielipankki KORPis, kus näiteks piiratud kasutustingimustega andmestikule pääsevad ligi ka Eesti teadlased oma teadusasutuse konto kaudu.

Uudis EKRK keeleuurimise vahendites on sisuotsingu süsteem RABA, kus lihtsast sõnapäringust alustades saab korraga infot nii EKRK KORPist, TTÜ kõnetehnoloogia ja TÜ foneetikalabori helikorpustest kui ka EKI Sõnaveebi sõnastikest.

Veelgi mahukamad andmestikud on kasutada RABA eeskujuks oleval CLARINi ühendatud sisuotsingul (Federated Content Search), mis otsib üle kõigi CLARINi registris kirjeldatud ressursside. Eestikeskse RABA ja Euroopa ühendatud sisuotsinguga saame kiiresti leida neid andmestikke, mis meid huvitavaid nähtusi sisaldavad. Nende põhjalikku kirjeldust, juurdepääsutingimusi ja sarnaste andmestike olemasolu on mugav leida Virtuaalsest Keeleobservatooriumist (Virtual Language Observatory, VLO), mis kogub ressursside kirjeldusi ja nende uuendusi automaatselt kõigist CLARINi keskustest ja muudestki digiarhiividest.

Kui VLO-st ei leia vajalikku eestikeelset andmestikku üles, pole seda ehk kirjeldatud EKRK keeleressursside registris Meta-share. Üksikasjalikule kirjeldusele ja nähtavusele lisaks on Metashare’il veel üks oluline eelis: kõik registreeritud keeleressursid saavad püsiidentifikaatori DOI, mille abil on lihtne vajalikku ressurssi taasleida ja viidata oma publikatsioonides.

 

Alamkategooriaid