CLARIN2020 konverents

Koroonaolukord on millegi jaoks ka hea, sest avab CLARINi aastakonverentsi 5.-7. oktoobrini veebis (Zoomi keskkonnas) ning palju laiemale huviliste ringile ja see kõik on tasuta, ainult registreerimise vaev! Konverentsi tutvustab ka CLARINi uudiskirja erinumber.

CLARINi aastakonverents toimub sel aastal, erinevalt eelmistest aastatest, täielikult virtuaalsena. Seekord soovitakse jõuda senisest laiema publikuni ja kasutada innovatiivseid veebipõhiseid lähenemisi; konverentsi kava hõlmab nüüd ka mitteformaalset programmi ja oodatud on ka kõik, kes varem pole konverentsil osalenud. Uutmoodi konverentsiprogrammi elementideks on näiteks:
 • Plenaaristungid näevad välja rohkem modereeritud vestluste moodi, kus püütakse tekitada varasemast rohkem ettekannete autorite ja publiku vahelist suhtlust.
 • Vaatmike (see on ingl k poster presentations soovituslik vaste ÕSi järgi) ehk plakatettekannete autoritega on võimalik suhelda jututoa-chati teel.
 • Esitluste slaidid, vaatmikud ning esitlustega seotud salvestised on konverentsi veebilehel saadaval enne konverentsi.
 • Eraldi sessioonid toimuvad doktorantidele ja õppejõududele, kes kasutavad oma töös CLARINi teadustaristu ressursse.
Soovitan heita pilk peale konverentsi programmile, sest  teemarubriike on palju ja huvipakkuvat leiab nii keeletehnoloogiast, märgendamisest, (digihumanitaaria kui ka kitsamalt keeleteaduse) analüüsimeetoditest ja -vahenditest, huvitavatest uurimisteemadest digihumanitaarias ja sotsiaalteadustes, andmekogudest ja nende hooldamisest, meta-andmetest ja õiguslikest probleemidest.
Kutsutud ettekanne:
Language Technology & Hypothesis Testing - Dr. Antske Fokkens  (Faculty of Humanities, Vrije Universiteit Amsterdam)
Kõikide ettekannete abstraktid on juba nähtavad siin ning ettekannete täistekstid siin.
 
Huvi võib pakkuda ka paneel "Artificial Intelligence, Language Data and Research Infrastructures" või viie eestlasest kaasautori osalusel ettekanne isikuandmete kaitse üldmääruse rakendamisest teadusasutuste poolt - "CLARIN Contractual Framework for Sharing Language Data: The Perspective of Personal Data Protection".
 
Konverentsi mitteformaalse osa programm:
 • 5. oktoobril 2020 kl 11:30 kuni 12:30 CLARINi veebikohvik, mille eesmärk anda kokkuvõtlik ülevaade CLARINi tegevusest. Registreerumine siin.
 • 6. oktoobril kl 11 kuni 12:45 pakutakse konverentsil osalejate vahelist suhtlusvõimalust virtuaalkeskkondades, registreerumine (sama mis kogu konverentsile) siin.
 • 7. oktoobril kl 12-12:30 toimub improvisatoorne uutmoodi online komöödiaetendus tehisintellekti teemadel "Improbotics" - see etendus on juba varem mujal tähelepanu äratanud ja ühe auhinnagi pälvinud, täpsemalt saab etenduse kohta lugeda siin.
Konverentsiprogramm hõlmab lisaks põhiprogrammile veel järgnevaid osi, kuhu veel on võimalik end osalejana kirja panna:
 • CLARIN Bazaar - innovatiivsete pilootprojektide esitlused
 • CLARINi tudengisessioon - võimalus doktorantidele esitleda tööd, mis toetub CLARINi infrastruktuurile või toetab seda
 • CLARINi konsulteerimissessioon - interdistsiplinaarsete või varases staadiumis olevate uurimisprojektide osalejad saavad küsida nõu CLARINi ekspertidelt
 • CLARIN klassiruumis - õpetajad saavad jagada (häid ja halbu) kogemusi CLARINi vahendite, ressursside jms kasutamise kohta.
Konverentsi arenguid saab sotsiaalmeedia kaudu jälgida Twitteris #CLARIN2020.
 
CLARIN on üle-euroopaline keeleressursside ja -tehnoloogia võrgustik, mille koostööpartner Eestis on Eesti Keeleressursside Keskus.

CLARINi veebikohvik kirjandusteadlastele

8. juulil toimus 3. CLARINi veebikohvik teadlastele: Kirjandusteadus. Seda modereeris CLARINi saadik Maciej Maryl (Poola Teaduste Akadeemia kirjandusliku uurimuse instituut).

Kohtumise eesmärgiks oli tutvustada digimeetodeid kirjandusteadlastele CLARINi tööriistade  varal. Sihtrühmaks olid uurijad, kes soovivad rakendada uusi meetodeid enda uurimisvaldkonnas ja tahaksid teada, kust alustada. CLARINi saadikud kaaluvad samasuguste ürituste korraldamist teiste sotsiaalia ja humanitaaria uurimisvaldkondade jaoks (nt ajalugu ja tõlketeadus).

Maciej Maryl alustas sissejuhatusega digihumanitaariasse ja selgitusega, kuidas CLARIN ja muud sarnased teadustaristud saavad uurijaid nende töös toetada. Kirjandusteaduslik CLARINi kohvik keskendus näidetele ja kasutusjuhtudele, mis edukalt lõimisid kirjandusteaduslikku uurimist digimeetoditega. Ettekanded avasid digitaalse kirjandusteaduse kolme aspekti: 1) korpuse loomine; 2) teksti märgendamine ja digitaalse väljaande ettevalmistamine ning 3) tekstianalüüs.

Esimese ettekande autorid Olga Gerassimenko (Tartu Ülikool, Eesti Keeleressursside Keskus) ja Marin Laak (Eesti Kirjandusmuuseum) rääkisid sellest, kuidas nad tegid oma ala ekspertidena koostööd Johannes Vares-Barbaruse ja Johannes Semperi käsikirjalisest kirjavahetusest digitaalse korpuse loomisel päringusüsteemi KORP abiga ning kuidas korpust on kasutatud kirjandusteadlasi huvitavate probleemide uurimisel. Marin on kirjandusteadlane ja Olga keeleteadlane ning arvutilingvist, ning koostöö Olgaga on aidanud Marinil lahendada uurimisküsimus, mis keskendus 1911-1940 aastate kirjavahetuses autorite Eesti-Euroopa identiteedile - ühist ettekannet saab vaadata videost.

Teises ettekandes jagas Beatrice Nava (Bologna Ülikool) oma kogemust traditsioonilise kirjandusuurijana, kes on alustanud digimeetodite rakendamist. Kaasaegse ja klassikalise filoloogi taustaga Beatrice kasutas uurimisküsimuste lahendamiseks DEA projekti: Archilochuse digiväljaannet, mis sai teoks tänu CLARIN-IT toetusele. DEA projekti eesmärgiks oli koostada kogu Archilochuse korpuse teaduslik digiväljaanne, mis oleks kasutatav nii uurijatele kui ka mitteakadeemilistele kasutajatele. Beatrice kirjeldas projekti valmimisfaase, mainides ka esimesi tulemusi ja lahendamist vajanud probleeme. Dea märgendatud korpus on hoiul CLARINi Itaalia konsortsiumi repositooriumis ILC4CLARIN . Beatrice rõhutas CLARINi kui olulist teejuhti uurijatele, kes pole veel tuttavad digitaalmeetoditega ja vajaksid selles keskkonnas esmast nõustamist. Ta tõi välja ka CLARIN mobiilsusgrante kui hindamatut võimalust uurijatele, kes tahaksid ekspertsust teatud alal omandada või teistega jagada.

Kolmandas ettekandes rääkis Joanna Byszuk (Poola Teaduste Akadeemia poola keele insituut) tekstianalüüsi ja stilomeetria kasutuse kogemusest WebStyML, mitmekeelse veebipõhise tööriistaga, mille on loonud CLARIN-PL koostöös Maciej Ederiga. Pärast lühikest sissejuhatust kauglugemise ja stilomeetria mehaanikasse kirjeldas Joanna stilomeetria kasutust praktikas, näiteks autorluse määramisel või korpusepõhisel idiolektide uurimisel, stilokronoloogias, žanriüleste või žanrisiseste suhete uurimisel.

65 osalejaga CLARINi kohvik jätkus pärast ettekandeid aktiivse diskussiooniga kuulajate ja esitlejate vahel, mis näitas selliste ürituste vajalikkust teadmiste vahetamisel. Laiale kasutajaskonnale mõeldud üritus suutis kokku tuua kirjandusteadlasi väga erinevate uurimisfookustega ja ühise huviga kasutada digimeetodeid kaasaegses humanitaarias, mis on oluline samm digihumanitaaria ja valdkonnasisese uurimistöö vahelise lünga täitmisel.

Kui te olete huvitatud koostööst humanitaarvaldkonna uurijate ja digiekspertide vahel, kaaluge registreerimist veebitöötoale Twin Talks III DH2020 konverentsil. Et saada regulaarset teavet CLARINi tegevustest, on võimalik tellida uudiskirja. Ülevaadet CLARINi pakutavatest rahastamisvõimalustest või saada rahastusleheküljelt. Soovitame tutvuda ka täienevate CLARINi ressurssiperedega

Veebiseminar "Hüpoteesid päringuteks: otsingud kirjanduslikest korpustest"

Esimene seminar sarjast "Best Practices on Digital Humanities",  mida korraldasid Eesti Keeleressursside Keskus ja Eesti-uuringute Tippkeskuse Kirjakultuuri ja kirjandusuuringute töörühm

EKRK spetsialistid kutsusid huvilisi arutama kirjanduslike tekstikorpuste loomise ja märgendamise teemal. 

 • Kuidas muuta oma uurimishüpoteesid korpusepäringuteks? 
 • Milliste kategooriate märgendamist oleks tarvis kriitikatekstide korpuses?

Korpusepäringute võimalusi demonstreeriti ajaloolise Semperi ja Barbaruse kirjavahetuse tekstikorpuse näitel päringusüsteemis KORP.

Veebiseminar toimus 26.05.20 kell 14.00-15.45 MS Teamsi keskkonnas, seminari viis läbi keeleressursside spetsialist Olga Gerassimenko.

Video -  KORPis leiduvad korpused ja näidisotsingud - 13 min

 • Mis ajaleht 1990-2000 on kõige luuletuselembesem
 • Kus kõige rohkem sõna “luuletus” ja selle derivaate kasutatakse - kas EPL, Postimees, SL Õhtuleht või Eesti Ekspress? 
 • statistika 2000-2001: mõisted nagu suhtarv ja absoluutarv, tegelikult EE-s kaks korda rohkem 

Video - Laiendatud otsingu näited ja vastused kuulajate küsimustele - 20 min

Avaseminari ühiskommentaarium https://tinyurl.com/avaseminar

Küsimused ja ettepanekud on teretulnud! See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.

Alamkategooriaid